“لاما” من ميتا: كل ما تحتاج معرفته عن نموذج الذكاء الاصطناعي المفتوح

بوابة الذكاء الاصطناعي - وحدة المتابعة

الإثنين - 9 سبتمبر 2024

75 4 دقائق

"لاما" من ميتا: كل ما تحتاج معرفته عن نموذج الذكاء الاصطناعي المفتوح- OIMEDIA News - بوابة الذكاء الاصطناعي

مثل كل شركات التكنولوجيا الكبرى في هذه الأيام، تمتلك ميتا نموذجها الخاص للذكاء الاصطناعي التوليدي، والذي يُعرف باسم “لاما”. “لاما” فريد من نوعه إلى حد ما بين النماذج الرئيسية لأنه “مفتوح”، مما يعني أن المطورين يمكنهم تنزيله واستخدامه كما يحلو لهم (مع بعض القيود). هذا على عكس نماذج مثل “كلود” من “أنثروبيك”، و”جي بي تي-4” من “أوبن إيه آي” (الذي يدعم “تشات جي بي تي”) و”جيميني” من “جوجل”، والتي لا يمكن الوصول إليها إلا عبر واجهات برمجة التطبيقات.

ولكن، حرصًا على منح المطورين خيارات، أبرمت ميتا شراكات مع بائعين مثل “أمازون ويب سيرفيسز”، و”جوجل كلاود”، و”مايكروسوفت أزور” لتوفير إصدارات “لاما” المُستضافة على السحابة. بالإضافة إلى ذلك، أصدرت الشركة أدوات مصممة لتسهيل ضبط النموذج وتخصيصه.

فيما يلي كل ما تحتاج معرفته عن “لاما”، بدءًا من قدراته وإصداراته وصولاً إلى أماكن استخدامه. سنقوم بتحديث هذه المقالة مع إصدار ميتا للترقيات وإدخال أدوات تطوير جديدة لدعم استخدام النموذج.

ما هو “لاما”؟

“لاما” هو مجموعة من النماذج – وليس نموذجًا واحدًا فقط:

“لاما 8B”
“لاما 70B”
“لاما 405B”

أحدث الإصدارات هي “لاما 3.1 8B”، و”لاما 3.1 70B”، و”لاما 3.1 405B”، والتي تم إصدارها في يوليو 2024. تم تدريبها على صفحات الويب بلغات متنوعة، والشفرة العامة والملفات على الويب، بالإضافة إلى البيانات الاصطناعية (أي البيانات التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي الأخرى).

“لاما 3.1 8B” و”لاما 3.1 70B” هما نموذجان صغيران مضغوطان مصممان للعمل على أجهزة تتراوح من أجهزة الكمبيوتر المحمولة إلى الخوادم. من ناحية أخرى، “لاما 3.1 405B” هو نموذج كبير الحجم يتطلب (في غياب بعض التعديلات) أجهزة مراكز البيانات. “لاما 3.1 8B” و”لاما 3.1 70B” أقل قدرة من “لاما 3.1 405B”، لكنهما أسرع. في الواقع، هما إصدارات “مُقطرة” من “405B”، مُحسنة لتقليل حجم التخزين وزمن الوصول.

جميع نماذج “لاما” لديها نوافذ سياقية تبلغ 128,000 رمز. (في علم البيانات، يتم تقسيم الرموز إلى أجزاء صغيرة من البيانات الخام، مثل مقاطع “مُعجِب”، و”تاس”، و”تيك” في كلمة “رائع”). يشير سياق النموذج، أو نافذة السياق، إلى بيانات الإدخال (مثل النص) التي يراعيها النموذج قبل إنشاء المخرجات (مثل نص إضافي). يمكن للسياق الطويل أن يمنع النماذج من “نسيان” محتوى المستندات والبيانات الحديثة، ومن الانحراف عن الموضوع والاستقراء الخاطئ.

تُترجم تلك الرموز البالغ عددها 128,000 إلى حوالي 100,000 كلمة أو 300 صفحة، والتي تُعادل تقريبًا طول “عاصفة غضب”، و”رحلات غوليفر”، و”هاري بوتر وسجين أزكابان”.

ما الذي يمكن أن يفعله “لاما”؟

مثل نماذج الذكاء الاصطناعي التوليدية الأخرى، يمكن لـ “لاما” أداء مجموعة متنوعة من المهام المساعدة، مثل البرمجة والإجابة على أسئلة الرياضيات الأساسية، بالإضافة إلى تلخيص المستندات بثماني لغات (الإنجليزية، الألمانية، الفرنسية، الإيطالية، البرتغالية، الهندية، الإسبانية، والتايلاندية). تقع معظم أحمال العمل القائمة على النص – فكر في تحليل ملفات مثل ملفات PDF وجداول البيانات – ضمن نطاق اختصاصه؛ لا يمكن لأي من نماذج “لاما” معالجة أو إنشاء الصور، على الرغم من أن ذلك قد يتغير في المستقبل القريب.

يمكن تكوين جميع نماذج “لاما” الأحدث للاستفادة من التطبيقات والأدوات وواجهات برمجة التطبيقات الخارجية لإنجاز المهام. تم تدريبها بشكل افتراضي على استخدام “بريف سيرش” للإجابة على الأسئلة حول الأحداث الأخيرة، وواجهة برمجة تطبيقات “وولفرام ألفا” للاستعلامات المتعلقة بالرياضيات والعلوم، ومترجم “بايثون” للتحقق من صحة الشفرة. بالإضافة إلى ذلك، تقول ميتا إن نماذج “لاما 3.1” يمكنها استخدام أدوات معينة لم ترها من قبل (لكن ما إذا كان يمكنها استخدام تلك الأدوات بشكل موثوق به هو مسألة أخرى).

أين يمكنني استخدام “لاما”؟

إذا كنت تبحث ببساطة عن الدردشة مع “لاما”، فهو يدعم تجربة دردشة “ميتا إيه آي” على “فيسبوك ماسنجر”، و”واتساب”، و”إنستغرام”، و”أوكلوس”، و”ميتا.آي”.

يمكن للمطورين الذين يقومون بالبناء باستخدام “لاما” تنزيل النموذج أو استخدامه أو ضبطه بدقة عبر معظم منصات السحابة الشائعة. تدعي ميتا أن لديها أكثر من 25 شريكًا يستضيفون “لاما”، بما في ذلك “إنفيديا”، و”داتابريكس”، و”جروك”، و”ديل”، و”سنو فليك”.

طور بعض هؤلاء الشركاء أدوات وخدمات إضافية فوق “لاما”، بما في ذلك أدوات تتيح للنماذج الرجوع إلى البيانات المملوكة وتمكنها من العمل بتأخيرات أقل.

تقترح ميتا استخدام نماذجها الأصغر، “لاما 8B” و”لاما 70B”، للتطبيقات العامة مثل تشغيل روبوتات الدردشة وإنشاء الشفرة. تقول الشركة إن “لاما 405B” أفضل للاحتفاظ به لعملية تقطير النموذج – عملية نقل المعرفة من نموذج كبير إلى نموذج أصغر وأكثر كفاءة – وإنشاء بيانات اصطناعية لتدريب (أو ضبط دقيق) نماذج بديلة.

من المهم ملاحظة أن ترخيص “لاما” يحد من كيفية نشر المطورين للنموذج: يجب على مطوري التطبيقات الذين لديهم أكثر من 700 مليون مستخدم شهري طلب ترخيص خاص من ميتا، والتي ستمنحه حسب تقديرها.

ما هي الأدوات التي تقدمها ميتا لـ “لاما”؟

بجانب “لاما”، توفر ميتا أدوات تهدف إلى جعل النموذج “أكثر أمانًا” للاستخدام:

“لاما جارد”، إطار عمل للرقابة
“برومبت جارد”، أداة لحماية ضد هجمات حقن المطالبات
“سايبير سيك إيفال”، مجموعة تقييم مخاطر الأمن السيبراني

يحاول “لاما جارد” اكتشاف المحتوى المحتمل أن يكون مشكلةً إما المُدخل إلى – أو المُنشأ بواسطة – نموذج “لاما”، بما في ذلك المحتوى المتعلق بالنشاط الإجرامي، واستغلال الأطفال، وانتهاكات حقوق النشر، والكراهية، وإيذاء النفس، والاعتداء الجنسي. يمكن للمطورين تخصيص فئات المحتوى المحظور، وتطبيق الحظر على جميع اللغات التي يدعمها “لاما” بشكل افتراضي.

مثل “لاما جارد”، يمكن لـ “برومبت جارد” حظر النص المخصص لـ “لاما”، لكن فقط النص المخصص “لهجوم” النموذج وإجباره على التصرف بطرق غير مرغوب فيها. تدعي ميتا أن “لاما جارد” يمكنه الدفاع ضد المطالبات الضارة بشكل صريح (مثل “كسر القفل” الذي يحاول تجاوز فلاتر الأمان المدمجة في “لاما”) بالإضافة إلى المطالبات التي تحتوي على “مدخلات مُحقنة”.

أما بالنسبة لـ “سايبير سيك إيفال”، فهو ليس أداة بقدر ما هو مجموعة من المقاييس لقياس أمان النموذج. يمكن لـ “سايبير سيك إيفال” تقييم المخاطر التي يمثلها نموذج “لاما” (على الأقل وفقًا لمعايير ميتا) لمطوري التطبيقات والمستخدمين النهائيين في مجالات مثل “الهندسة الاجتماعية الآلية” و”توسيع نطاق العمليات السيبرانية الهجومية”.

قيود “لاما”

يأتي “لاما” مع بعض المخاطر والقيود، مثل جميع نماذج الذكاء الاصطناعي التوليدية.

على سبيل المثال، من غير الواضح ما إذا كانت ميتا قد دربت “لاما” على محتوى محمي بحقوق النشر. إذا فعلت ذلك، فقد يكون المستخدمون مسؤولين عن الانتهاك إذا انتهى بهم الأمر إلى استخدام مقطع محمي بحقوق النشر دون قصد، والذي تم إرجاعه بواسطة النموذج.

وفقًا لتقارير “رويترز” الأخيرة، استخدمت ميتا في وقت ما الكتب الإلكترونية المحمية بحقوق النشر لتدريب الذكاء الاصطناعي على الرغم من تحذيرات محاميها. تدرب الشركة بشكل مثير للجدل ذكاءها الاصطناعي على منشورات “إنستغرام” و”فيسبوك” والصور والعناوين، وتجعل من الصعب على المستخدمين الخروج من ذلك. ما هو أكثر من ذلك، فإن ميتا، إلى جانب “أوبن إيه آي”، هي موضوع دعوى قضائية جارية رفعتها مجموعة من المؤلفين، بما في ذلك الكوميدية “سارة سيلفرمان”، بشأن استخدام الشركتين المزعوم للبيانات المحمية بحقوق النشر دون إذن لتدريب النماذج.

البرمجة هي مجال آخر من الحكمة توخي الحذر عند استخدام “لاما”. ذلك لأن “لاما” قد ينتج – مثل نظرائه من الذكاء الاصطناعي التوليدي – شفرة بها أخطاء أو غير آمنة.

كما هو الحال دائمًا، من الأفضل أن يكون لديك خبير بشري يراجع أي شفرة تم إنشاؤها بواسطة الذكاء الاصطناعي قبل دمجها في خدمة أو برنامج.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي

الوسوم