DeepSeek تطلق نماذج R1-Zero وتنافس OpenAI بأداء مميز

مراجعة : ياسين عبد العزيز

الأربعاء، 22 يناير 2025 10:17 ص

DeepSeek

أعلنت شركة DeepSeek الصينية عن إطلاق مجموعة جديدة من نماذج الذكاء الاصطناعي التي تحمل اسم R1 وR1-Zero، لتدخل بذلك منافسة قوية مع نماذج التفكير المنطقي المتقدمة مثل o1 التي تقدمها OpenAI. حيث تم تصميم هذه النماذج لتقديم أداء عالٍ في مجالات الاستدلال والتحليل، مما يضعها في صدارة تقنيات الذكاء الاصطناعي الحديثة.

نماذج R1-Zero

يتميز نموذج R1 الجديد بأداءه الذي يضاهي نماذج o1 الشهيرة من OpenAI، وهي النماذج المعروفة بسرعتها في التفكير والتحليل المعمق، حيث تستغرق وقتًا أطول لتقديم الإجابات بعد إجراء تقييم شامل للمعلومات.

وعلى الرغم من التحديات التي قد تواجه مثل هذه النماذج في بعض الأحيان، فإن DeepSeek قد استطاعت تقديم نماذج R1 التي تدعي الشركة أنها تقدم أداء مماثلاً أو حتى أفضل في بعض المعايير الخاصة بالاستدلال المعقد.

وبالإضافة إلى النماذج الكبرى، طرحت DeepSeek أيضًا 6 نماذج مفتوحة المصدر أصغر حجمًا، تتراوح بين 1.5 و 70 مليار معلمة، والتي تمتاز بقدرتها على تقديم أداء قوي في التفسير والاستنتاج، حتى أنها تفوق في بعض الحالات أداء النماذج الأكبر حجمًا مثل OpenAI-o1-mini، هذه النماذج الصغيرة تم تطويرها باستخدام 800 ألف مثال تدريبي تم توليدها بواسطة نموذج R1 الأكبر.

أحد أبرز ما يميز نموذج R1-Zero هو طريقته في التعلم المعزز (Reinforcement Learning)، التي لا تعتمد على أمثلة بشرية مسبقة، وقد طُوّر هذا النموذج لتعلم الاستدلال باستخدام نظام مكافآت مبسّط، يعتمد على التقييم الذاتي للأجوبة والتحقق من صحتها، سواء كان ذلك في المسائل الرياضية أو البرمجية، هذه الطريقة جعلت النموذج أكثر قدرة على التعامل مع مجموعة متنوعة من التحديات المعقدة.

لكن النموذج لم يكن خاليًا من التحديات، إذ واجه مشكلتين رئيسيتين تمثلت في صعوبة قراءة الإجابات واختلاط اللغات في بعض الأحيان، وبناءً على هذه الملاحظات، عملت الشركة على تحسين النموذج عبر إدخال مراحل متعددة من التعلم المعزز، مما أدى إلى تطوير نموذج R1، الذي أظهر أداءً قويًا في اختبارات الاستدلال، مع نتائج تتفوق على العديد من النماذج الأخرى.

اختبارات الأداء أظهرت أن نموذج DeepSeek-R1 قادر على تحقيق أداء يقارب نموذج OpenAI-o1-1217، وهو ما يعد إنجازًا كبيرًا في عالم الذكاء الاصطناعي، وقد تم التركيز على تطوير نماذج أصغر يمكنها تقديم نتائج مشابهة للنماذج الأكبر، مثل R1-Distill-Llama-70B و R1-Distill-Qwen-32B، التي أظهرت قدرات استدلالية مدهشة تفوقت في بعض الأحيان على النماذج ذات الحجم الأكبر.

أعلنت DeepSeek عن توفر نماذج R1 برخصة MIT، مما يسمح للمطورين والباحثين باستخدامها وتخصيصها بحرية، يمكن الوصول إلى هذه النماذج عبر منصات GitHub و HuggingFace، أو عبر واجهة برمجية (API) خاصة بالشركة، والتي تتيح للمستخدمين إمكانية استخدام هذه النماذج بأسعار أقل بكثير مقارنة بتلك التي تقدمها OpenAI.

هذه الإطلاقات تأتي بعد إطلاق نموذج DeepSeek-V3، الذي يُعد من أقوى النماذج المفتوحة المصدر في العالم، حيث يتنافس مع نماذج مثل GPT-4.

ومع تزايد المنافسة في سوق الذكاء الاصطناعي، تُعد هذه الخطوة من DeepSeek بمثابة تحدي حقيقي لـ OpenAI، وتعكس سعي الشركات الصينية للوصول إلى الريادة في هذا المجال المتطور.

من خلال هذه الخطوات، تُظهر DeepSeek التزامها بتقديم تقنيات مبتكرة في عالم الذكاء الاصطناعي، وتوسيع نطاق قدرات الذكاء الاصطناعي المفتوح المصدر الذي يُعد خيارًا متميزًا للباحثين والمطورين حول العالم.

لمتابعة المزيد من الأخبار اضغط هنــــــــــــــــــــــــــــــــــــــــــــــــــــــا