أعلنت شركة Meta يوم الثلاثاء عن إطلاق عائلة جديدة مفتوحة المصدر من نماذج لغات الذكاء الاصطناعي المشهورة باسم Llama 2. تتراوح حجم النماذج في هذه العائلة من 7 إلى 70 مليار معلومة، وتتميز بترخيص تجاري يسمح باستخدامها في المنتجات التجارية. ووفقًا لأقوال شركة Meta، فإن هذه النماذج تتفوق على النماذج المفتوحة المصدر في معظم المعايير التي تم اختبارها.
وقد غرّد Yann LeCun، كبير علماء الذكاء الاصطناعي، قائلاً: “سيؤدي هذا إلى تغيير المشهد في سوق LLM”. وستتوفر نماذج Llama-v2 على Microsoft Azure، وستكون متاحة على AWS و Hugging Face ومزودي خدمات آخرين.
على الرغم من عدم قدرته على المنافسة مع GPT-4 من OpenAI في الأداء ، يبدو أن Llama 2 يتفوق بشكل جيد بالنسبة لنموذج مفتوح المصدر. ووفقًا لجيم فان ، العالم الرئيسي في الذكاء الاصطناعي في Nvidia ، “70B قريب من GPT-3.5 في المهام الاستدلالية ، ولكن هناك فجوة كبيرة في مقاييس البرمجة. إنه يتفوق على PaLM-540B في معظم المقاييس ، ولكنه لا يزال يتخلف بشكل كبير عن GPT-4 و PaLM-2-L.” يمكن العثور على مزيد من التفاصيل حول أداء Llama 2 ومقاييسه وبنائه في ورقة بحث نشرتها Meta يوم الثلاثاء.
في شهر فبراير ، أصدرت Meta سابق Llama 2 ، LLaMA ، كمصدر مفتوح بترخيص غير تجاري. وكانت متاحة رسميًا فقط للأكاديميين ذوي الأوراق المعتمدة المحددة. ومن ثم تم تسريب وزن LLaMA (الملفات التي تحتوي على قيم المعلمات للشبكات العصبية المدربة) على مواقع التورنت ، وانتشرت على نطاق واسع في مجتمع الذكاء الاصطناعي. وسرعان ما ظهرت الإصدارات المحسنة من LLaMA ، مثل Alpaca ، والتي قدمت بذرة لساحة LLM التنموية السريعة النمو.
يجلب Llama 2 هذا النشاط بشكل أكبر إلى الانتشار مع سماحه للاستخدام التجاري، على الرغم من أن المرخصين المحتملين الذين لديهم “أكثر من 700 مليون مستخدم نشط شهريًا في الشهر السابق” يجب أن يطلبوا إذنًا خاصًا من Meta لاستخدامه ، مما يمنع ربما استخدامه المجاني من قبل عمالقة مثل آمازون أو جوجل.
وتثير نماذج الذكاء الاصطناعي مفتوحة المصدر الكثير من الجدل، إذ يشير منتقدوها إلى المخاطر المحتملة مثل إساءة الاستخدام في البيولوجيا التركيبية أو إنتاج رسائل غير مرغوبة أو معلومات مضللة.
تميزت Meta بوقوفها بمفردها بين عمالقة التكنولوجيا في دعم النماذج المفتوحة المصدر الرئيسية، بينما تعمل شركات أخرى مثل OpenAI و Microsoft و Google على تطوير نماذج خاصة بهم.
نشرت Meta أيضًا “بيانًا داعمًا للنهج المفتوح لـ Meta في الذكاء الاصطناعي الحالي” الذي يقول: “نحن ندعم نهج الابتكار المفتوح في الذكاء الاصطناعي. يمنحنا الابتكار المسؤول والمفتوح حصة في عملية تطوير الذكاء الاصطناعي ، مما يجلب الرؤية والفحص والثقة في هذه التقنيات. فتح نماذج Llama اليوم سيسمح للجميع بالاستفادة من هذه التكنولوجيا”. وحتى بعد ظهر يوم الثلاثاء ، تم توقيع البيان من قبل مجموعة من المديرين التنفيذيين والمعلمين مثل Drew Houston (الرئيس التنفيذي لـ Dropbox) و Matt Bornstein (شريك في Andreessen Horowitz) و Julien Chaumond (المدير التقني لـ Hugging Face) و Lex Fridman (عالم البحوث في MIT) و Paul Graham (الشريك المؤسس لـ Y Combinator).
على الرغم من أن Llama 2 هو مصدر مفتوح ، إلا أن Meta لم تكشف عن مصدر بيانات التدريب المستخدمة في إنشاء نماذج Llama 2 ، وهو ما أشارت إليه الباحثة في Mozilla Senior Fellow of Trustworthy AI Abeba Birhane على تويتر. لا يزال عدم شفافية بيانات التدريب هو نقطة ملحوظة لبعض النقاد لـ LLM لأن بيانات التدريب التي تعلم هذه الـ LLM ما يعرفونه غالبًا ما تأتي من خلال جمع غير مصرح به من الإنترنت بدون اهتمام يذكر بالخصوصية أو التأثير التجاري. يقول Meta إنه “بذل جهدًا لإزالة البيانات من بعض المواقع المعروفة بوجود حجم عالٍ من المعلومات الشخصية عن الأفراد الخاصة” في ورقة بحث Llama 2 ، ولكنها لم تذكر ما هي تلك المواقع.
حاليًا ، يمكن لأي شخص طلب الحصول على إذن لتنزيل Llama 2 عن طريق ملء نموذج على موقع Meta. تقدم Ars Technica طلبًا للتنزيل وتلقت رابط تنزيل بعد حوالي ساعة ، مما يشير إلى أن القائمة قد تم فحصها يدويًا.








