كتب مايكل فارس
السبت، 24 يناير 2026 09:00 صكشف تقرير بحثي جديد عن نتائج "صادمة" لاختبار قياسي عالمي يُدعى "Apex-Agents"، والذي تم تصميمه لتقييم قدرة وكلاء الذكاء الاصطناعي على أداء مهام وظائف "الياقات البيضاء" الحقيقية في قطاعات البنوك والاستشارات والقانون. وأظهرت النتائج أن أفضل الموديلات الحالية، بما في ذلك "Gemini 3 Flash" من جوجل، حققت نسبة نجاح لم تتجاوز 24% فقط في تنفيذ المهام المطلوبة، مما يضع وعود الأتمتة الشاملة للشركات تحت مجهر النقد العلمي والتقني.
أسباب ضعف الوكلاء وفقاً لموقع "AI Agent Store" وتقارير تقنية، تكمن المشكلة الجوهرية في عدم قدرة الوكلاء الأذكياء على التعامل مع المعلومات المشتتة عبر أدوات متعددة مثل "Slack" و"Google Drive" بالطريقة التي يقوم بها البشر. وأوضح الباحثون أن الوكلاء يعانون من "فقدان السياق" عند الانتقال بين المنصات المختلفة، مما يؤدي إلى أخطاء فادحة في اتخاذ القرارات أو تنفيذ الأوامر الإدارية، وهو ما يعني أن مكان العمل الآلي لا يزال بعيد المنال.
تشير هذه النتائج إلى أن التحول نحو "القوة العاملة السيليكونية" قد يستغرق وقتاً أطول بكثير مما توقعته شركات التكنولوجيا الكبرى.
وأكدت التقارير أن 52% من قادة الشركات يعتبرون المخاوف الأمنية والامتثال هي العائق الأكبر أمام نشر هؤلاء الوكلاء، حيث لا تزال الأغلبية تشترط وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية تماماً.
تحديات الموثوقية في بيئات العمل المعقدةأثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة بالغة في التنسيق بين المهام المتعددة التي تتطلب "فهماً دلالياً" متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مغامرة تقنية غير محسوبة النتائج حالياً.
أولوية الحوكمة على القدرات الخام يتفق خبراء الأمان على أن الموثوقية والحوكمة تظلان أهم من القدرات الحسابية الخام، حيث يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي.
ملحوظة: مضمون هذا الخبر تم كتابته بواسطة اليوم السابع ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من اليوم السابع ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.
