نقدم لكم زوارنا الكرام أهم وآخر المستجدات كما وردت في المقال التالي: بأقل من 50 دولاراً .. منافس مفتوح لـ "أوبن أيه آي" و "ديب سيك" - الخليج الان اليوم الجمعة 7 فبراير 2025 09:55 صباحاً
اشتعلت المنافسة في مجال الذكاء الاصطناعي بين الشركات لتحقيق التقدّم في هذا المجال الذي يعصف بالعديد من الشركات الكبرى، فقد تمكن باحثو الذكاء الاصطناعي في جامعة ستانفورد وجامعة واشنطن من تدريب نموذج "استدلال" للذكاء الاصطناعي مقابل أقل من 50 دولارًا في رصيد الحوسبة السحابية، وفقًا لورقة بحثية جديدة صدرت يوم الجمعة الماضي.
ويعمل النموذج المعروف باسم s1 بشكل مشابه لنماذج التفكير المتطورة، مثل o1 من OpenAI وR1 من DeepSeek، في الاختبارات التي تقيس قدرات الرياضيات والترميز.
ويتوفر نموذج s1 على GitHub ، إلى جانب البيانات والرمز المستخدم لتدريبه.
وقال الفريق الذي يقف وراء s1 إنهم بدأوا بنموذج أساسي جاهز للاستخدام، ثم قاموا بضبطه من خلال التقطير، وهي عملية لاستخراج قدرات "الاستدلال" من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجاباته.
قال الباحثون إن s1 مستمدة من أحد نماذج التفكير المنطقي الخاصة بشركة Google، وهو Gemini 2.0 Flash Thinking Experimental. والتقطير هو نفس النهج الذي استخدمه باحثو بيركلي لإنشاء نموذج تفكير منطقي للذكاء الاصطناعي مقابل حوالي 450 دولاراً في الشهر الماضي ، وفقا لموقع تك كرانش.
قد يبدو الأمر مثيرا بالنسبة لبعض الناس، إذ قد يتمكن عدد قليل من الباحثين الذين لا يملكون الملايين من الدولارات من الابتكار في مجال الذكاء الاصطناعي. ولكن الجزء الأول يثير تساؤلات حقيقية حول تحويل نماذج الذكاء الاصطناعي إلى سلعة تجارية.
أين تكمن إذا كان بإمكان شخص ما تكرار نموذج بملايين الدولارات عن كثب بمبلغ بسيط نسبيًا؟
ومن غير المستغرب أن مختبرات الذكاء الاصطناعي الكبيرة ليست سعيدة بهذا الأمر. فقد اتهمت شركة OpenAI شركة DeepSeek بجمع البيانات بشكل غير صحيح من واجهة برمجة التطبيقات الخاصة بها لأغراض استخلاص النماذج .
كان الباحثون وراء s1 يتطلعون إلى إيجاد أبسط نهج لتحقيق أداء قوي في التفكير و"التوسع في وقت الاختبار"، أو السماح لنموذج الذكاء الاصطناعي بالتفكير أكثر قبل الإجابة على سؤال.
وكانت هذه بعض الاختراقات في o1 من OpenAI، والتي حاولت DeepSeek ومختبرات الذكاء الاصطناعي الأخرى تكرارها من خلال تقنيات مختلفة.
تشير الورقة البحثية s1 إلى أنه يمكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة نسبيًا باستخدام عملية تسمى الضبط الدقيق الخاضع للإشراف (SFT)، حيث يتم توجيه نموذج الذكاء الاصطناعي صراحةً لمحاكاة سلوكيات معينة في مجموعة بيانات.
تميل تقنية SFT إلى أن تكون أرخص من طريقة التعلم التعزيزي واسعة النطاق التي استخدمتها DeepSeek لتدريب منافستها لنموذج o1 الخاص بـ OpenAI، R1.
وتقدم Google إمكانية الوصول المجاني إلى Gemini 2.0 Flash Thinking Experimental، وإن كان ذلك مع حدود سعرية يومية، عبر منصة Google AI Studio.
ومع ذلك، تحظر شروط جوجل إجراء هندسة عكسية لنماذجها لتطوير خدمات تتنافس مع عروض الذكاء الاصطناعي التي تقدمها الشركة.
يعتمد S1 على نموذج ذكاء اصطناعي صغير جاهز للاستخدام من مختبر الذكاء الاصطناعي الصيني Qwen المملوك لشركة Alibaba، والذي يتوفر للتنزيل مجانًا.
لتدريب s1، أنشأ الباحثون مجموعة بيانات مكونة من 1000 سؤال فقط تم اختيارها بعناية، مقترنة بإجابات على تلك الأسئلة، بالإضافة إلى عملية "التفكير" وراء كل إجابة من برنامج Gemini 2.0 Flash Thinking Experimental من Google.
وبعد تدريب s1، والذي استغرق أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية من نوع Nvidia H100، حقق s1 أداءً قويًا في معايير الذكاء الاصطناعي المحددة، وفقًا للباحثين. وقال نيكلاس موينجوف، الباحث في جامعة ستانفورد الذي عمل في المشروع، لـ TechCrunch إنه يمكنه استئجار الحوسبة اللازمة اليوم مقابل حوالي 20 دولارًا.
واستخدم الباحثون خدعة ذكية لجعل s1 يعيد التحقق من عمله ويطيل وقت "التفكير": لقد طلبوا منه الانتظار. ساعدت إضافة كلمة "انتظر" أثناء تفكير s1 النموذج على الوصول إلى إجابات أكثر دقة قليلاً، وفقًا للورقة البحثية.
وتخطط Meta وGoogle وMicrosoft لاستثمار مئات المليارات من الدولارات في البنية التحتية للذكاء الاصطناعي ، والتي ستذهب جزئيًا إلى تدريب نماذج الذكاء الاصطناعي من الجيل التالي.
ولكن هذا المستوى من الاستثمار قد يظل ضرورياً لدفع حدود الابتكار في مجال الذكاء الاصطناعي إلى أقصى حد. فقد أثبتت عملية التقطير أنها وسيلة جيدة لإعادة خلق قدرات نموذج الذكاء الاصطناعي بتكلفة زهيدة، ولكنها لا تخلق نماذج ذكاء اصطناعي جديدة أفضل كثيراً من النماذج المتاحة اليوم.
0 تعليق