مشروع جديد يجعل بيانات ويكيبيديا متاحة للذكاء الاصطناعى

0 نشر

الخميس 02 أكتوبر 2025 04:10 صباحاً 0

تبليغ

كتبت سماح لبيب

الخميس، 02 أكتوبر 2025 04:00 ص

أعلنت مؤسسة ويكيبيديا ألمانيا عن مشروع جديد باسم "مشروع تضمين بيانات ويكي"، بالتعاون مع شركتي داتا ستاكس وجينا، يهدف هذا المشروع إلى جعل البيانات الهائلة الموجودة على ويكيبيديا ومواقعها الشقيقة، والتي تبلغ حوالي 120 مليون إدخال، أكثر سهولة في الوصول إليها واستخدامها من قبل نماذج الذكاء الاصطناعي.

يعتمد المشروع على تقنية البحث الدلالي القائم على المتجهات، مما يمكّن أنظمة الذكاء الاصطناعي من فهم المعنى والعلاقات بين الكلمات بشكل أفضل، وليس مجرد البحث عن كلمات مفتاحية بسيطة.

وهذا يسهّل استخدام اللغة الطبيعية في الاستعلام عن البيانات، مما يلغي الحاجة إلى لغات استعلام متخصصة مثل SPARQL التي كانت تستخدم سابقًا.

وتساهم هذه المبادرة في توفير بيانات عالية الجودة وموثوقة لتدريب نماذج الذكاء الاصطناعي، فبدلاً من الاعتماد على مجموعات بيانات عشوائية ومحدودة الدقة مثل "Common Crawl"، يمكن للمطورين الآن بناء نماذجهم على معرفة تم التحقق منها من قبل محرري ويكيبيديا.

كما أن البيانات مُهيكلة لتوفير سياق دلالى غنى، مثل ربط كلمة "عالم" بمعلومات عن علماء بارزين أو مفاهيم مشابهة.

يؤكد فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، أن هذه المبادرة تهدف إلى إظهار أن الذكاء الاصطناعي يمكن أن يكون مفتوحًا وتعاونيًا، وليس حكرًا على عدد قليل من الشركات الكبرى. المشروع متاح للعامة على Toolforge، مما يجعله موردًا يمكن لأي مطور استخدامه بحرية.

ملحوظة: مضمون هذا الخبر تم كتابته بواسطة اليوم السابع ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من اليوم السابع ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.

إقرأ ايضا

قد تقرأ أيضا

97% من القراء يطالبون بتغليظ عقوبة البلطجة واستعراض القوة

لا داعى لإغلاق المدارس.. الصحة: إصابات فيروس HFMD لا تشكل خطرا (فيديو)

الأسرع والأكثر راحة.. مواعيد قطار تالجو الفاخر اليوم الخميس 2-10-2025

شروط حصول الطلاب على درجات حافز التفوق الرياضى للبطولات

تفاصيل محاور وأهداف المؤتمر الدولى الأول للذكاء الاصطناعى بحامعة القاهرة

غرامة تصل 2 مليون جنيه عقوبة عدم الإبلاغ عن عيب بالمنتج خلال 7 أيام

إبحث فى الموقع