OpenAI o3-mini و DeepSeek-R1
أطلقت OpenAI نموذج الذكاء الاصطناعي الجديد o3-mini، والذي بات متاحًا لجميع مستخدمي ChatGPT، وذلك بعد فترة قصيرة من إطلاق DeepSeek-R1، النموذج الصيني الذي لاقى اهتمامًا واسعًا بفضل قدراته المتقدمة وتكلفته المنخفضة، منذ ذلك الحين، بدأ المستخدمون والخبراء في عقد مقارنات بين هذين النموذجين لتحديد أيهما يقدم أداءً أفضل في مختلف المهام.
تعتمد هذه المقارنة على نتائج اختبار LiveBench، وهو أحد أكثر التقييمات دقة لقياس أداء النماذج اللغوية في مجالات مثل الرياضيات، البرمجة، التفكير المنطقي، تحليل البيانات، والقدرة على الفهم اللغوي.
عند قياس متوسط الأداء العام، حصل o3-mini على 73.94 نقطة، بينما حصل DeepSeek-R1 على 71.38 نقطة، مما يشير إلى تفوق o3-mini بفارق بسيط، هذا الأداء انعكس بشكل واضح في بعض المجالات، لا سيما البرمجة والتفكير المنطقي.
التفكير والاستدلال: OpenAI تتفوق
في المهام التي تتطلب التحليل المنطقي والاستدلال، تفوق o3-mini بشكل واضح، إذ حصل على 89.58 نقطة مقابل 83.17 نقطة لـ DeepSeek-R1، هذا يشير إلى قدرة o3-mini على تحليل البيانات بشكل أعمق وأدق، ما يجعله خيارًا قويًا للتطبيقات التي تحتاج إلى قرارات منطقية دقيقة.
تفوق ملحوظ لـ o3-mini في البرمجة
في مجال البرمجة، كانت النتائج أكثر وضوحًا، حيث سجل o3-mini 82.74 نقطة، متفوقًا بفارق كبير على DeepSeek-R1 الذي سجل 66.74 نقطة، يوضح ذلك قدرة o3-mini على فهم التعليمات البرمجية، وتصحيح الأخطاء، وتقديم حلول أكثر دقة وكفاءة.
الرياضيات: DeepSeek-R1 يتفوق
على الرغم من تفوق o3-mini في معظم المجالات، فإن DeepSeek-R1 حقق تفوقًا كبيرًا في الرياضيات، حيث حصل على 79.54 نقطة، متجاوزًا o3-mini الذي سجل 65.65 نقطة، يعكس ذلك قدرة DeepSeek-R1 على الاستدلال العددي ومعالجة المسائل الرياضية بكفاءة أعلى، مما يجعله خيارًا مناسبًا للتطبيقات التي تعتمد على الحسابات الدقيقة.
تحليل البيانات والفهم اللغوي
في مجال تحليل البيانات، تفوق o3-mini بشكل طفيف بحصوله على 70.64 نقطة مقابل 69.78 نقطة لـ DeepSeek-R1، أما في المهام اللغوية، فقد تفوق الأول أيضًا، إذ حصل على 50.68 نقطة مقارنة بـ 48.53 نقطة للمنافس الصيني، ما يعكس قدرة أفضل نسبيًا في معالجة اللغة الطبيعية وفهم النصوص.
اختبارات أخرى: o3-mini يتقدم في حل الألغاز ودقة الإجابات
في اختبار NYT Connections، الذي يقيس قدرة النموذج على حل الألغاز، حصل o3-mini على 72.4 نقطة مقابل 54.4 نقطة لـ DeepSeek-R1، مما يعكس تفوقًا واضحًا في التفكير الاستنتاجي.
أما في اختبار Humanity’s Last Exam، الذي يقيم دقة الإجابات، فقد حقق o3-mini نتيجة 13%، متجاوزًا DeepSeek-R1 الذي سجل 9.4%، مما يدل على قدرة أعلى في تقديم إجابات دقيقة وصحيحة.
التكلفة: DeepSeek-R1 أكثر اقتصادية
من حيث الأسعار، يتفوق DeepSeek-R1 في كونه أقل تكلفة، حيث يبلغ سعر كل مليون رمز إدخال 14 سنتًا، مقارنة بـ 55 سنتًا لنموذج o3-mini، أما سعر كل مليون رمز إخراج، فهو 2.19 دولار لـ DeepSeek-R1، مقابل 4.40 دولار لـ o3-mini، هذه الفروقات تجعل DeepSeek-R1 خيارًا أكثر توفيرًا للمطورين الذين يبحثون عن نموذج منخفض التكلفة.
الخلاصة: أي النموذجين أفضل؟
o3-mini يتفوق في الأداء العام، التفكير المنطقي، البرمجة، والفهم اللغوي.
DeepSeek-R1 يتفوق في الرياضيات والتكلفة المنخفضة.
o3-mini يقدم دقة أعلى في الإجابات وحل الألغاز.
بالنظر إلى هذه النتائج، يعد o3-mini الخيار الأفضل لمن يحتاج إلى نموذج قوي في البرمجة، التحليل المنطقي، والمهام اللغوية، بينما يناسب DeepSeek-R1 المستخدمين الباحثين عن أداء رياضي قوي وكفاءة اقتصادية.
الخميس، 19 مايو 2022 01:04 م
الخميس، 19 مايو 2022 01:04 م
الخميس، 19 مايو 2022 01:30 م
الخميس، 19 مايو 2022 11:00 م
الجمعة، 20 مايو 2022 03:00 م
الجمعة، 20 مايو 2022 03:19 م
الخميس، 20 فبراير 2025 09:18 م
الخميس، 20 فبراير 2025 03:56 م
الخميس، 20 فبراير 2025 03:47 م
الخميس، 20 فبراير 2025 03:41 م
الأحد، 16 فبراير 2025 09:37 ص
السبت، 11 يناير 2025 11:51 ص
الإثنين، 23 ديسمبر 2024 09:21 م
الأربعاء، 11 ديسمبر 2024 01:13 م
ابحث عن مواصفات هاتفك
ماركات الموبايلات
أضغط هنا لمشاهدة كل الماركاتأحدث الموبايلات
Apple iPhone 13 Pro Max
Xiaomi Redmi Note 11
Samsung Galaxy A52s
OPPO Reno6 Pro 5G
realme GT2 Pro
vivo Y19
Honor 50 Pro
Huawei Nova 9
Nokia 8.3 5G
Back Top