كتبت سماح لبيب
الخميس، 02 أكتوبر 2025 04:00 صأعلنت مؤسسة ويكيبيديا ألمانيا عن مشروع جديد باسم "مشروع تضمين بيانات ويكي"، بالتعاون مع شركتي داتا ستاكس وجينا، يهدف هذا المشروع إلى جعل البيانات الهائلة الموجودة على ويكيبيديا ومواقعها الشقيقة، والتي تبلغ حوالي 120 مليون إدخال، أكثر سهولة في الوصول إليها واستخدامها من قبل نماذج الذكاء الاصطناعي.
يعتمد المشروع على تقنية البحث الدلالي القائم على المتجهات، مما يمكّن أنظمة الذكاء الاصطناعي من فهم المعنى والعلاقات بين الكلمات بشكل أفضل، وليس مجرد البحث عن كلمات مفتاحية بسيطة.
وهذا يسهّل استخدام اللغة الطبيعية في الاستعلام عن البيانات، مما يلغي الحاجة إلى لغات استعلام متخصصة مثل SPARQL التي كانت تستخدم سابقًا.
وتساهم هذه المبادرة في توفير بيانات عالية الجودة وموثوقة لتدريب نماذج الذكاء الاصطناعي، فبدلاً من الاعتماد على مجموعات بيانات عشوائية ومحدودة الدقة مثل "Common Crawl"، يمكن للمطورين الآن بناء نماذجهم على معرفة تم التحقق منها من قبل محرري ويكيبيديا.
كما أن البيانات مُهيكلة لتوفير سياق دلالى غنى، مثل ربط كلمة "عالم" بمعلومات عن علماء بارزين أو مفاهيم مشابهة.
يؤكد فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، أن هذه المبادرة تهدف إلى إظهار أن الذكاء الاصطناعي يمكن أن يكون مفتوحًا وتعاونيًا، وليس حكرًا على عدد قليل من الشركات الكبرى. المشروع متاح للعامة على Toolforge، مما يجعله موردًا يمكن لأي مطور استخدامه بحرية.
ملحوظة: مضمون هذا الخبر تم كتابته بواسطة اليوم السابع ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من اليوم السابع ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.