DeepSeek-V3.. نموذج ذكاء اصطناعي صيني يُحدث نقلة نوعية

مراجعة : ياسين عبد العزيز

الإثنين، 30 ديسمبر 2024 12:16 م

DeepSeek-V3

أعلنت شركة DeepSeek AI الصينية المتخصصة في الذكاء الاصطناعي عن إطلاق نموذجها الجديد DeepSeek-V3، الذي يُعدّ من أقوى النماذج المفتوحة المصدر في العالم.

يهدف النموذج إلى تحقيق تحول جذري في مجال الذكاء الاصطناعي المفتوح المصدر، ويُظهر كفاءة غير مسبوقة مقارنة بالنماذج المغلقة المصدر.

تقنية Mixture-of-Experts (MoE)

يعتمد DeepSeek-V3 على تقنية متقدمة تُدعى "Mixture-of-Experts" (MoE)، التي تتيح للنموذج تفعيل عدد معين من المعاملات (Parameters) فقط عند معالجة كل إدخال نصي، مما يزيد من الكفاءة بشكل كبير، يضم النموذج 671 مليار معلمَة، ويقوم بتفعيل 37 مليار معلمَة لكل إدخال نصي، ما يجعل النموذج أكثر كفاءة ودقة في معالجة البيانات.

أداء مذهل وتفوق على النماذج الكبرى

من خلال اختبارات الأداء القياسية للذكاء الاصطناعي، تفوق DeepSeek-V3 على العديد من النماذج الشهيرة المغلقة المصدر، مثل GPT-4 من OpenAI و Claude 3.5 من شركة Anthropic.

أظهر النموذج أداء رائدًا في تسعة معايير رئيسية، متفوقًا على كافة النماذج الأخرى من نفس الفئة، ويعد هذا التفوق دليلاً على القدرات الاستثنائية التي يوفرها هذا النموذج في تطبيقات الذكاء الاصطناعي.

تكلفة التدريب والفعالية الاقتصادية

يتطلب تدريب نموذج DeepSeek-V3 ما يقارب 2.788 مليون ساعة تدريب باستخدام وحدات معالجة الرسوميات H800، بتكلفة إجمالية تقدر بحوالي 5.6 مليون دولار.

على الرغم من حجم النموذج الكبير، فإن تكلفة تدريبه تعتبر منخفضة مقارنة بنماذج منافسة، مثل Llama 3 من شركة Meta، الذي يحتوي على 405 مليار معلمَة ويتطلب حوالي 30.8 مليون ساعة تدريب.

DeepSeek-V3.. نموذج ذكاء اصطناعي صيني يُحدث ثورة في النماذج المفتوحة المصدر

يعود انخفاض التكلفة إلى التقنيات المتطورة التي يعتمد عليها النموذج، بالإضافة إلى التحسينات الهندسية العميقة التي تم إدخالها لتحسين الكفاءة.

كفاءة التشغيل وتقليص الفجوة بين النماذج المفتوحة والمغلقة المصدر

فيما يتعلق بالكفاءة التشغيلية، يقدم DeepSeek-V3 أداء استثنائيًا، حيث تكون تكلفة الإدخال في هذا النموذج أقل بعشر مرات مقارنة بنماذج رائدة أخرى، مثل تلك التي تقدمها OpenAI.

يعكس ذلك قدرة DeepSeek-V3 على تقديم حلول مبتكرة وبأسعار معقولة، مما يجعله متاحًا لشريحة واسعة من المستخدمين والشركات الصغيرة والمتوسطة.

إتاحة النموذج للمجتمع التقني

يُعد DeepSeek-V3 خطوة هامة نحو توفير النماذج المتقدمة في الذكاء الاصطناعي على نطاق أوسع، النموذج متاح حاليًا للتنزيل عبر منصتي GitHub و HuggingFace، مما يتيح للمطورين والباحثين الوصول إليه واستخدامه لتطوير حلول مبتكرة.

يشير فريق DeepSeek إلى أن هذا النموذج يمثل نقطة تحول في تقليص الفجوة بين النماذج المفتوحة والمغلقة المصدر، مما يوفر فرصة أكبر للجميع للوصول إلى تقنيات الذكاء الاصطناعي المتقدمة.

يعتبر DeepSeek-V3 بداية لثورة في مجال الذكاء الاصطناعي المفتوح المصدر، ومع تزايد الاعتماد على الذكاء الاصطناعي في مختلف القطاعات، يُتوقع أن يشكل هذا النموذج نقلة نوعية في كيفية استخدام هذه التقنيات في الأعمال والبحث العلمي.

ومن المتوقع أن تستمر DeepSeek في تحسين أدائها وتقديم حلول أكثر تقدمًا، مما يعزز دورها في دفع عجلة الابتكار في هذا المجال.