أدوات إبداعيةبرامج وتطبيقات

أنثروبيك تطلق نماذج كلاود الجديدة وميزة “التحكم بالكمبيوتر”

بوابة الذكاء الاصطناعي - وحدة المتابعة

أعلنت شركة أنثروبيك عن ترقيات جديدة لمجموعة نماذج الذكاء الاصطناعي الخاصة بها، بما في ذلك نموذج كلاود 3.5 سونيت (Claude 3.5 Sonnet) المُحسّن، وإطلاق نموذج كلاود 3.5 هايكو (Claude 3.5 Haiku)، بالإضافة إلى ميزة “التحكم بالكمبيوتر” (computer control) في مرحلة تجريبية عامة.

يُظهر نموذج كلاود 3.5 سونيت المُحسّن تحسينات كبيرة في جميع المقاييس، مع تقدم ملحوظ بشكل خاص في قدرات البرمجة. وقد حقق النموذج نسبة 49.0% في معيار SWE-bench Verified، متجاوزًا جميع النماذج المتاحة للجمهور، بما في ذلك عروض OpenAI وأنظمة البرمجة المتخصصة.

وفي تطور رائد، قدمت أنثروبيك وظيفة استخدام الكمبيوتر التي تُمكّن كلاود من التفاعل مع أجهزة الكمبيوتر بطريقة مشابهة للبشر: عرض الشاشات، والتحكم بالمؤشرات، والنقر، والكتابة. وتُعد هذه الميزة، التي لا تزال في مرحلة تجريبية عامة، نموذج كلاود 3.5 سونيت أول نموذج ذكاء اصطناعي رائد يوفر مثل هذه الوظائف. وقد أشارت شركة GitLab إلى أن “كلاود 3.5 سونيت المُحسّن يمثل قفزة كبيرة في مجال البرمجة المُعتمدة على الذكاء الاصطناعي”، حيث لاحظت تحسينًا يصل إلى 10% في المنطق عبر حالات الاستخدام دون زيادة زمن الانتظار.

أما نموذج كلاود 3.5 هايكو الجديد، المقرر إطلاقه في وقت لاحق من هذا الشهر، فيُطابق أداء نموذج كلاود 3 أوبس السابق مع الحفاظ على الكفاءة من حيث التكلفة والسرعة. وقد حقق نسبة 40.6% في معيار SWE-bench Verified، متفوقًا على العديد من النماذج المنافسة بما في ذلك نموذج كلاود 3.5 سونيت الأصلي و GPT-4o.

وبخصوص قدرات التحكم بالكمبيوتر، اتبعت أنثروبيك نهجًا مدروسًا، مع الاعتراف بالقيود الحالية مع تسليط الضوء على الإمكانات المستقبلية. وفي معيار OSWorld، الذي يقيم التنقل في واجهة الكمبيوتر، حقق نموذج كلاود 3.5 سونيت نسبة 14.9% في اختبارات لقطات الشاشة فقط، متفوقًا بشكل كبير على أفضل نظام منافس بنسبة 7.8%.

وقد خضعت هذه التطورات لتقييمات سلامة صارمة، مع إجراء اختبارات ما قبل النشر بالشراكة مع معهدي سلامة الذكاء الاصطناعي في كل من الولايات المتحدة والمملكة المتحدة. وتؤكد أنثروبيك أن معيار ASL-2، كما هو موضح في سياسة النشر المسؤولة الخاصة بها، لا يزال مناسبًا لهذه النماذج.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى