مفاجأة.. الذكاء الاصطناعي يفشل في "مهمة بسيطة" يؤديها البشر

مفاجأة.. الذكاء الاصطناعي يفشل في "مهمة بسيطة" يؤديها البشر - الصبح

غير مصنف الحكاية الأحد 16 مارس 2025 08:57 مساءً

مفاجأة.. الذكاء الاصطناعي يفشل في "مهمة بسيطة" يؤديها البشر - الصبح

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
مفاجأة.. الذكاء الاصطناعي يفشل في "مهمة بسيطة" يؤديها البشر - الصبح, اليوم الأحد 16 مارس 2025 08:57 مساءً

يستطيع الذكاء الاصطناعي توليد صور واقعية، وكتابة روايات، وإنجاز واجباتك المدرسية، وحتى التنبؤ ببنية البروتينات.

ومع ذلك، كشف بحث جديد أنه غالبًا ما يفشل في مهمة أساسية بسيطة للغاية: تحديد الوقت.

واختبر باحثون في جامعة إدنبرة قدرة سبعة نماذج لغوية كبيرة متعددة الوسائط معروفة -وهي نوع من الذكاء الاصطناعي قادر على تفسير وإنشاء أنواع مختلفة من الوسائط- على الإجابة عن أسئلة متعلقة بالوقت بناءً على صور مختلفة للساعات أو التقويمات.

وأظهرت دراستهم، التي ستُنشر في أبريل، أن النماذج اللغوية الكبيرة تواجه صعوبة في هذه المهام الأساسية، بحسب تقرير لموقع "Gizmodo" المتخصص في أخبار التكنولوجيا.

وكتب الباحثون في الدراسة أن القدرة على تفسير الوقت والتفكير فيه استنادًا إلى المدخلات البصرية أمر بالغ الأهمية للعديد من التطبيقات في العالم الحقيقي، بدءًا من جدولة الأحداث وصولاً إلى الأنظمة المستقلة.

وأضافوا أنه على الرغم من التقدم الذي تحقق في النماذج اللغوية الكبيرة متعددة الوسائط، فإن معظم الأبحاث ركزت على اكتشاف الأشياء، وتوضيح الصور، أو فهم المشاهد، مما ترك الاستدلال الزمني دون استكشاف كافٍ.

ما هي الدراسة؟

اختبر الباحثون نماذج "GPT-4o" و"GPT-o1" من "أوبن إيه آي"، و"Gemini 2.0" من "غوغل ديب مايند"، و"Claude 3.5 Sonnet" من "أنثروبيك"، و"Llama 3.2-11B-Vision-Instruct" من "ميتا"، و"Qwen2-VL7B-Instruct" من "علي بابا"، و"MiniCPM-V-2.6" من "ModelBest".

وغذى الباحثون النماذج بصور مختلفة لساعات تناظرية -ساعات بأرقام رومانية، وألوان مختلفة، وبعضها حتى يفتقد عقرب الثواني- بالإضافة إلى صور تقويم لعشر سنوات.

وفي ما يتعلق بصور الساعات، سأل الباحثون النماذج: ما هو الوقت الموضح بالساعة في الصورة؟ بالنسبة لصور التقويم، طرح الباحثون أسئلة بسيطة مثل: ما هو يوم رأس السنة الميلادية؟ واستفسارات أكثر تعقيدًا مثل: ما هو اليوم 153 من السنة؟

بشكل عام، لم يكن أداء أنظمة الذكاء الاصطناعي جيدًا. فقد قرأت الوقت على الساعات التناظرية بشكل صحيح في أقل من 25% من الحالات.

وواجهت النماذد صعوبة في قراءة الساعات التي تحمل أرقامًا رومانية وعقارب منمقة، تمامًا كما واجهت صعوبة في قراءة الساعات التي لا تحتوي على عقرب ثوانٍ، مما يشير إلى أن المشكلة قد تنبع من اكتشاف العقارب وتفسير الزوايا على وجه الساعة، وفقًا للباحثين.

وحقق نموذج "Gemini-2.0" أعلى الدرجات في مهمة الساعة التي وضعها الفريق، بينما كان "GPT-o1" دقيقًا في مهمة التقويم بنسبة 80%، وهي نتيجة أفضل بكثير من منافسيه. ولكن حتى في هذه الحالة، ارتكب نماذج اللغة الكبيرة الأكثر نجاحًا أخطاءً في مهمة التقويم بنسبة 20% تقريبًا.

وأوضح الباحثون أن قراءة الساعة التناظرية وفهم التقويم يتطلبان خطوات معرفية معقدة، إذ يتطلبان إدراكًا بصريًا دقيقًا مثل، موقع عقارب الساعة) وتفكير عددي معقد (مثل، حساب اختلافات الأيام).

اشترك فى النشرة البريدية لتحصل على اهم الاخبار بمجرد نشرها

تابعنا على مواقع التواصل الاجتماعى

اشترك فى النشرة البريدية لتحصل على اهم الاخبار بمجرد نشرها

مواضيع متعلقة