تحديات أمام الذكاء الاصطناعي.. لماذا تعجز النماذج التوليدية عن حل المسائل الرياضية؟

مراجعة : ياسين عبد العزيز

السبت، 05 أكتوبر 2024 12:37 م

الذكاء الاصطناعي

الذكاء الاصطناعي

في عالم الذكاء الاصطناعي، تبرز النماذج اللغوية الكبيرة كواحدة من أبرز الابتكارات التقنية الحديثة، حيث أثبتت قدرتها على إنتاج نصوص معقدة وإبداعية، ومع ذلك، تظهر هذه النماذج ضعفا ملحوظا عندما يتعلق الأمر بحل المسائل الرياضية، مما يطرح تساؤلات حول حدود قدراتها.

لقد أحدثت النماذج اللغوية الكبيرة، مثل ChatGPT وGemini، ثورة في مجالات متعددة، بدءًا من التأليف الإبداعي وانتهاءً بتبسيط المعلومات المعقدة. 

رغم ذلك، يُظهر الأداء الرياضي لهذه النماذج ضعفًا واضحًا، فعلى سبيل المثال، نجد أن نموذج Claude من شركة Anthropic لا يستطيع التعامل مع المسائل الكلامية، بينما نموذج Gemini من جوجل يواجه صعوبات في فهم المعادلات التربيعية، ويعاني نموذج Llama من ميتا من عدم القدرة على إجراء عمليات الجمع الأساسية.

التناقض بين المهارات اللغوية والفشل الرياضي

يمكن أن يكون من المدهش أن نرى نماذج تتمتع بقدرة عالية على فهم النصوص والتعبير الإبداعي تعجز عن التعامل مع العمليات الحسابية البسيطة. لذلك، من المهم استكشاف الأسباب وراء هذا التناقض. 

يُشير العديد من الخبراء إلى أن الفشل في حل المسائل الرياضية يعود إلى الطريقة التي تعالج بها هذه النماذج اللغة والرموز.

تستند النماذج اللغوية الكبيرة إلى عملية تُسمى "التجزئة" (Tokenization)، التي تتضمن تقسيم النص إلى وحدات أصغر تُعرف بالتوكنز. 

صورة

هذه العملية، رغم أهميتها، تؤدي إلى فقدان بعض المعلومات الدقيقة، خاصة عندما يتعلق الأمر بالأرقام والعلاقات العددية، على سبيل المثال، قد يعامل النموذج الرقم 380 كرمز واحد، بينما يمثل الرقم 381 كزوج من الأرقام 38 و1، هذا يمكن أن يؤثر بشكل كبير على قدرة النموذج على إجراء العمليات الحسابية بدقة.

تعتمد النماذج على الإحصاء والاحتمالات للتنبؤ بالكلمات التالية في الجمل. تقوم بتحليل كميات ضخمة من البيانات النصية لتحديد الأنماط الإحصائية، مما قد يؤدي إلى أخطاء عند التعامل مع سياقات غير مألوفة أو طلبات استدلالية معقدة، فعلى سبيل المثال، إذا طُلب من ChatGPT ضرب عددين كبيرين مثل 57897 و12832، فإنه يعتمد على الأنماط التي تعلمها من البيانات التدريبية، مما يؤدي إلى نتائج خاطئة.

إحدى الدراسات التي أجراها يونتيان دينج، الأستاذ المساعد في جامعة واترلو، أظهرت أن النموذج المتقدم GPT-4o يُظهر دقة أقل من 30% في مسائل تتطلب إجراء عمليات ضرب تحتوي على أكثر من أربعة أرقام. 

وأكد دينج أن الخطأ في أي خطوة وسيطة في العمليات الحسابية يمكن أن يتضاعف، مما يؤدي إلى نتائج غير صحيحة في النهاية.

المحتمل

يُطرح سؤال مهم هنا: إلى متى ستبقى الرياضيات تمثل تحديًا لهذه النماذج؟ تشير دراسة حديثة أجراها يونتيان دينج وفريقه إلى إمكانية تحسين أداء النماذج في مجال الرياضيات. على الرغم من أن نموذج GPT-4o واجه صعوبات، إلا أن نموذج o1 الجديد، الذي أُطلق في سبتمبر، أظهر نتائج واعدة، حيث تمكن من حل مسائل ضرب تتكون من تسعة أرقام بشكل صحيح في نصف الوقت.

يمثل هذا التطور علامة إيجابية على أن هذه النماذج يمكن أن تتعلم وتتحسن بمرور الوقت، مما يفتح الأبواب لإمكانيات جديدة في مجالات مثل التعليم والبحث العلمي. 

ورغم التحديات المستمرة، يظل هناك أمل في أن تصبح النماذج مثل ChatGPT أكثر كفاءة في التعامل مع العمليات الرياضية، خاصة تلك التي تعتمد على خوارزميات واضحة.

تعرف على سعر ومواصفات هاتف realme 11 4g

الإثنين، 27 نوفمبر 2023 06:00 م

تعرف على سعر ومواصفات A98 5G من OPPO

الأحد، 26 نوفمبر 2023 03:25 م

ابحث عن مواصفات هاتفك

Back Top