كشفت شركة إنفيديا عن نظام تعلّم روبوتي جديد يحمل اسم DoorMan، يتيح للروبوتات البشرية فتح الأبواب بسرعة وكفاءة تفوق أداء المشغلين البشريين، وقد خضع النظام للاختبار على الروبوت البشري Unitree G1 الذي تبلغ قيمته 16 ألف دولار، وذلك باستخدام كاميرات RGB المدمجة فقط، واعتمادًا بالكامل على التعلم المعزز المدرب داخل بيئات محاكاة دون أي تعديلات إضافية في العالم الحقيقي. وأظهرت التجارب الميدانية قدرة الروبوت المدعوم بنظام DoorMan على تنفيذ مهمة فتح الأبواب بسرعة تصل إلى 31% أعلى من الخبراء البشريين، مع تحقيق معدل نجاح أكبر، ويُعد هذا الإنجاز خطوة مهمة في مجال “التحكم الحركي-المناوراتي”، الذي يجمع بين المشي والرؤية والتنسيق وتحريك الأطراف بالتزامن داخل بيئة تفاعلية. ويعتمد النظام على أسلوب “من البكسل إلى الحركة”، حيث يتم تدريب الروبوت بالكامل داخل منصة محاكاة Isaac Lab الخاصة بإنفيديا، ثم يُنقَل النموذج إلى الروبوت الحقيقي دون أي إعادة تدريب، وعلى عكس العديد من الروبوتات الحالية التي تحتاج إلى حساسات عمق أو أنظمة تتبع، فإن DoorMan يعتمد فقط على رؤية كاميرا تقليدية، مما يجعله أكثر مرونة في البيئات غير المتوقعة. وتغلب الباحثون على مشكلة شائعة في التدريب المعزز، وهي صعوبة الاستكشاف عندما يفشل الروبوت في اكتشاف سلسلة الحركات المطلوبة، ولحل ذلك، استخدموا تقنية “إعادة الترتيب المرحلي”، حيث يتم حفظ نقطة نجاح الروبوت في التقاط مقبض الباب داخل المحاكاة، ليبدأ منها في التدريبات اللاحقة، هذا الأسلوب ساعد النظام على التدرب على مراحل متقدمة من المهمة دون إعادة تعلم كل خطوة من البداية. كما عالج الفريق مشكلة فقدان رؤية المقبض عندما يقترب الروبوت كثيرًا من الباب، وذلك من خلال تقنية Group Relative Policy Optimization، التي تدفع النموذج لاتخاذ سلوكيات تحافظ على العناصر المهمة في مجال الرؤية، وسمح ذلك للروبوت بالتراجع قليلاً أو ضبط حركة رأسه للحفاظ على رؤية مقبض الباب أثناء المناورة. ويستفيد روبوت Unitree G1 من شعبيته الواسعة في الأبحاث العالمية، حيث بات منصة أساسية لدى العديد من المؤسسات مثل جامعة كاليفورنيا في سان دييغو وجامعة بوردو وفِرَق الروبوتات التابعة لشركات كبرى، وفي دراسة DoorMan، تمت مقارنة الروبوت التلقائي بمشغلين بشريين يستخدمون نظام تحكم عبر الواقع الافتراضي، ليتضح أن البشر غالبًا يواجهون صعوبة في الإحساس بقوة المفصل أو يتسببون بحركات زائدة تفقد الروبوت توازنه. وبحسب الدراسة، حقق النظام الآلي نسبة نجاح 83%، مقابل 80% للمشغلين الخبراء و60% لغير الخبراء، ويعزو الباحثون هذا التفوق إلى تنوع سيناريوهات المحاكاة، حيث جرى تدريب النظام على ملايين من الأبواب المختلفة في العرض والصلابة والمواد وأشكال المقابض، ليصبح العالم الحقيقي مجرد حالة إضافية ضمن نطاق التدريب الواسع. ويصف الباحثون DoorMan بأنه أول نظام روبوتي قادر على تنفيذ مهام حركية معقدة باستخدام رؤية RGB فقط، مع تدريب كامل داخل المحاكاة ونقل مباشر إلى الواقع دون أي تعديل، وهو ما يمثل خطوة كبيرة نحو جيل جديد من الروبوتات القادرة على التعلم بسرعة وبأقل اعتماد على بيانات بشرية.