دراسة تكشف احتمالية تدريب نموذج DeepSeek-R1 باستخدام بيانات ChatGPT

مراجعة : ياسين عبد العزيز

السبت، 08 مارس 2025 01:26 م

DeepSeek و ChatGPT

أظهر تقرير حديث صادر عن شركة Copyleaks، المتخصصة في تحليل النصوص بالذكاء الاصطناعي والكشف عن السرقات الأدبية، أن نموذج الذكاء الاصطناعي DeepSeek-R1 قد يكون قد تم تدريبه على بيانات ChatGPT الخاصة بشركة OpenAI.

ووفقًا للتقرير، فإن بصمة النموذج اللغوية تتطابق مع أسلوب OpenAI بنسبة تصل إلى 74.2%، مما يثير تساؤلات حول مصادر بياناته التدريبية ومدى قانونية استخدامها.

تشابه كبير بين DeepSeek-R1 وChatGPT

اعتمدت Copyleaks في دراستها على تحليل أسلوب كتابة DeepSeek-R1 باستخدام مصنفات ذكاء اصطناعي متقدمة، هذه المصنفات مدربة على نصوص صادرة من أربعة نماذج رئيسية، وهي Claude، Gemini، Llama، وOpenAI.

وأظهرت النتائج أن أسلوب DeepSeek-R1 يتشابه بشكل كبير مع أسلوب OpenAI، مما يعزز فرضية اعتماده على بيانات ChatGPT في تدريبه.

ويعود هذا التشابه المحتمل إلى إعلان شركة DeepSeek أنها استخدمت نهج "التقطير" (Distillation) خلال عملية التدريب، وهو أسلوب يعتمد على استخدام مخرجات نموذج ذكاء اصطناعي متقدم لتدريب نموذج آخر، بدلًا من بناء نموذج جديد من الصفر، هذا النهج يقلل من تكاليف التدريب، لكنه يثير مخاوف تتعلق بحقوق الملكية الفكرية، خاصة إذا تم استخدام بيانات من نماذج مغلقة المصدر مثل ChatGPT دون تصريح رسمي.

تأثير DeepSeek على سوق الذكاء الاصطناعي

منذ إطلاقه، تسبب نموذج DeepSeek-R1 باضطرابات كبيرة في سوق الذكاء الاصطناعي، ما أدى إلى خسائر بلغت تريليون دولار في سوق الأسهم الأمريكية.

يرى المستثمرون أن قدرة الشركات الجديدة على تدريب نماذج متطورة دون إنفاق مليارات الدولارات قد تعيد تشكيل الصناعة بشكل جذري.

وكانت هذه التطورات السريعة سببًا في تراجع أسهم شركات التكنولوجيا الكبرى مثل إنفيديا، التي تعتمد بشكل رئيسي على بيع العتاد المستخدم في تطوير نماذج الذكاء الاصطناعي، ونتيجة لذلك، تكبدت الشركة أكبر خسائر في القطاع التقني، حيث فقدت نسبة كبيرة من قيمتها السوقية في فترة وجيزة.

غياب الشفافية يثير الجدل حول شرعية DeepSeek

على الرغم من الضجة التي أثارها، لم تقدم شركة DeepSeek الصينية أي تفاصيل واضحة حول مصادر بياناتها التدريبية، هذا الغموض زاد من التكهنات حول ما إذا كانت الشركة قد استخدمت بيانات ChatGPT دون إذن، وهو ما قد يمنحها ميزة غير عادلة مقارنة بالشركات الأخرى التي تعتمد على بيانات مشروعة وقوانين صارمة في تطوير نماذجها.

وقد سبق لشركة OpenAI أن وجهت اتهامات إلى DeepSeek باستخدام مخرجات ChatGPT في تدريب نماذجها، لكنها لم تقدم أدلة قاطعة تثبت ذلك، ومع ذلك، يرى بعض الخبراء أن DeepSeek قد تواجه قيودًا أو حظرًا في الولايات المتحدة في المستقبل، إذا ثبت أنها انتهكت سياسات الملكية الفكرية لشركات الذكاء الاصطناعي الأمريكية.

مستقبل DeepSeek في ظل المنافسة العالمية

يأتي هذا الجدل في وقت تتسابق فيه الشركات الكبرى لتطوير نماذج ذكاء اصطناعي أكثر كفاءة، فمن جهة، تواصل OpenAI، Google، وMeta استثماراتها في نماذج الذكاء الاصطناعي المتطورة، ومن جهة أخرى، تظهر شركات صينية مثل DeepSeek، التي تحاول تقديم بدائل قوية مع تقليل تكاليف التدريب.

في ظل هذه التطورات، تبقى الأسئلة مفتوحة حول مستقبل DeepSeek، ومدى قدرتها على المنافسة في سوق الذكاء الاصطناعي دون الاصطدام بالعقوبات أو القيود التنظيمية.

لمتابعة صفحة موبايل نيوز على فيسبوك اضغط هنــــــــــــــــــــــــــــــــــــــــــــــــــــــا