رغم الوعود الواسعة بالإبداع اللامحدود، تكشف دراسة علمية جديدة أن مولدات الصور المعتمدة على الذكاء الاصطناعي تعاني من حدود واضحة في الخيال البصري، فبحسب بحث نُشر في دورية Patterns، تميل هذه النماذج، عند إعادة تفسير الصور مرارًا، إلى التخلي سريعًا عن التفرد، والاستقرار في عدد محدود من الأساليب البصرية المتكررة، لا يتجاوز 12 نمطًا. الدراسة، التي اختبرت نماذج شهيرة مثل Stable Diffusion XL وLLaVA، تصف النتائج بأنها أشبه بـ«موسيقى المصاعد البصرية»: صور أنيقة ومصقولة، لكنها بلا روح فنية حقيقية، مألوفة إلى حد الملل، وصالحة أكثر لجدران الفنادق منها لقاعات المعارض. تجربة «الهاتف المرئي» لاختبار خيال الآلة لاختبار حدود الإبداع لدى الذكاء الاصطناعي، صمّم الباحثون تجربة أطلقوا عليها اسم «لعبة الهاتف المرئي»، مستوحاة من لعبة الطفولة الشهيرة التي يتغير فيها المعنى مع انتقال الرسالة بين الأشخاص. بدأت التجربة بمنح نموذج Stable Diffusion XL مطالبة نصية شاعرية تقول:«بينما كنت أجلس وحيدًا وسط الطبيعة، عثرت على كتاب قديم من ثماني صفحات فقط، يحكي قصة بلغة منسية تنتظر من يقرأها ويفهمها». حوّل النموذج النص إلى صورة، ثم قُدمت الصورة إلى نموذج LLaVA ليصفها بالكلمات، أُعيدت هذه الوصفية النصية مرة أخرى إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر هذا التبادل بين الصورة والوصف 100 مرة متتالية، في ما يشبه غرفة صدى رقمية مغلقة. اختفاء الفكرة الأصلية خلال جولات قليلة كما هو متوقع في لعبة «الهاتف»، بدأ المعنى الأصلي في التلاشي بسرعة، فبحلول الجولة العاشرة أو العشرين، لم يعد هناك أي تشابه يُذكر بين الصورة الجديدة والفكرة الأولى، لكن المفاجأة الحقيقية لم تكن في التشويه، بل في التقارب. عبر أكثر من 1000 تجربة مختلفة، لاحظ الباحثون أن النماذج كانت تنتهي دائمًا تقريبًا إلى نفس الوجهات البصرية: منارات، أفق مدن ليلية، عمارة ريفية، مشاهد داخلية عامة، وصور مألوفة تفتقر إلى الجرأة أو الغرابة. 12 نمطًا بصريًا تهيمن على الخيال الاصطناعي الدراسة خلصت إلى أن جميع سلاسل الصور تقريبًا كانت «تنهار» في نهاية المطاف إلى واحد من 12 نمطًا بصريًا مهيمنًا، بغض النظر عن مدى غرابة أو شاعرية أو تجريدية النص الأصلي، فإن النتيجة النهائية كانت دائمًا صورة تبدو مألوفة بشكل مقلق. التحول، بحسب الباحثين، يحدث غالبًا بشكل تدريجي، حيث تفقد الصور خصوصيتها جولة بعد أخرى، وأحيانًا يقع الانهيار فجأة، لتتحول السلسلة بالكامل إلى مشهد نمطي بلا ملامح فنية مميزة، لكن الوجهة النهائية كانت واحدة دائمًا. تغيير النماذج لا يغيّر النتيجة حتى عند استبدال النماذج المستخدمة، أو استخدام إصدارات مختلفة من أدوات التوليد والوصف، استمرت الظاهرة نفسها. بل إن تمديد التجربة إلى 1000 جولة عزز النتيجة أكثر، فبحلول الجولة المئة تقريبًا، تستقر السلسلة البصرية على نمط واحد، وتتحول الجولات اللاحقة إلى مجرد اختلافات طفيفة على الفكرة نفسها. وجاء في الدراسة:«عبر 1000 تكرار مختلف للعبة الهاتف، وجد الباحثون أن معظم سلاسل الصور تنتهي إلى واحد فقط من 12 نمطًا بصريًا مهيمنًا». ماذا يعني ذلك لمفهوم الإبداع الاصطناعي؟ يرى الباحثون أن هذه النتائج تطرح تساؤلات جوهرية حول طبيعة الإبداع لدى الذكاء الاصطناعي، ففي حين يُدخل البشر عادة تفسيرات غير متوقعة وانحرافات شخصية عند نقل الأفكار، تميل النماذج الذكية إلى تنعيم الاختلافات وإزالة الشذوذ، وتوضح الدراسة:«في لعبة الهاتف البشرية، ينتهي الأمر بتباين شديد لأن كل شخص يسمع ويفسر الرسالة بطريقته، الذكاء الاصطناعي يعاني من المشكلة المعاكسة تمامًا؛ فمهما كان النص الأصلي غريبًا، يعود دائمًا إلى مجموعة ضيقة من الأساليب». ويعزو الباحثون هذا السلوك، جزئيًا، إلى طبيعة بيانات التدريب نفسها. فالذكاء الاصطناعي يتعلم من صور أنشأها البشر، ومعظم الصور المنتشرة على الإنترنت تنتمي إلى فئات متشابهة: مناظر طبيعية، شوارع، غرف داخلية، وغروب الشمس، ومن هنا، يصبح من الطبيعي أن يعيد الذكاء الاصطناعي تشغيل «الألحان البصرية» الأكثر شيوعًا. إبداع بلا مفاجآت؟ تكشف هذه الدراسة أن الذكاء الاصطناعي، رغم قدرته على إنتاج صور جميلة تقنيًا، لا يزال محكومًا بإطار ضيق من التقاليد البصرية، وبينما قد يكون ذلك كافيًا للاستخدامات التجارية أو الترفيهية، فإنه يضع علامة استفهام كبيرة حول قدرة الآلة على منافسة الإبداع البشري الحقيقي، القائم على المفاجأة، والمجازفة، وكسر المألوف.