برنامج لتطوير معايير شاملة لتقييم أداء وتأثير نماذج الذكاء الاصطناعي
بوابة الذكاء الاصطناعي - وحدة المتابعة
أعلنت شركة Anthropic عن إطلاق برنامج لتمويل تطوير أنواع جديدة من المعايير القادرة على تقييم أداء وتأثير نماذج الذكاء الاصطناعي، بما في ذلك النماذج التوليدية مثل Claude الخاصة بها.
وينص البرنامج الجديد على دفع مدفوعات لمنظمات خارجية قادرة على “قياس القدرات المتقدمة في نماذج الذكاء الاصطناعي” على حد وصف الشركة. وسيتم تقييم الطلبات المقدمة بشكل متواصل.
وأوضحت Anthropic أن هدف هذا الاستثمار هو “رفع مستوى مجال سلامة الذكاء الاصطناعي ككل، وتوفير أدوات قيمة تفيد النظام البيئي بأكمله”. كما أقرت الشركة بتحديات تطوير تقييمات عالية الجودة ذات صلة بالسلامة، والطلب المتزايد عليها.
وتشمل المواضيع المستهدفة للتقييمات الجديدة القدرة على تنفيذ هجمات إلكترونية، و”تعزيز” أسلحة الدمار الشامل، وخداع أو تضليل الناس. كما ستدعم الشركة أبحاثا حول معايير لمساعدة الذكاء الاصطناعي في الدراسات العلمية والتواصل متعدد اللغات وتخفيف التحيز المتأصل.
وتأمل Anthropic أن يكون برنامجها بمثابة “محفز للتقدم نحو مستقبل يصبح فيه التقييم الشامل للذكاء الاصطناعي معيارًا صناعيًا”.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي