تقارير ومتابعاتبرامج وتطبيقات

Qwen2-Math: ثورة جديدة في عالم الذكاء الاصطناعي الرياضي

بوابة الذكاء الاصطناعي - وحدة المتابعة

كشفت فريق Qwen التابع لشركة Alibaba Cloud عن Qwen2-Math، وهي سلسلة من نماذج اللغات الكبيرة مصممة خصيصًا لمعالجة المشكلات الرياضية المعقدة.

تُظهر هذه النماذج الجديدة، التي تم بناؤها على أساس Qwen2 الحالي، كفاءة ملحوظة في حل التحديات الحسابية والرياضية، متفوقة على قادة الصناعة السابقين.

صمم فريق Qwen Qwen2-Math باستخدام مجموعة واسعة ومتنوعة من البيانات الرياضية. تتضمن هذه المجموعة مجموعة غنية من الموارد عالية الجودة، بما في ذلك النصوص الإلكترونية والكتب والرموز وأسئلة الامتحانات والبيانات الاصطناعية التي تم إنشاؤها بواسطة Qwen2 نفسها.

كشفت التقييمات الدقيقة على معايير رياضية باللغة الإنجليزية والصينية – بما في ذلك GSM8K و Math و MMLU-STEM و CMATH و GaoKao Math – عن القدرات الاستثنائية لـ Qwen2-Math. لا سيما أن النموذج الرائد، Qwen2-Math-72B-Instruct، تجاوز أداء النماذج الخاصة مثل GPT-4o و Claude 3.5 في العديد من المهام الرياضية.

وأشار فريق Qwen إلى أن “Qwen2-Math-Instruct يحقق أفضل أداء بين النماذج ذات الحجم نفسه، حيث يتفوق RM@8 على Maj@8، خاصة في نماذج 1.5B و 7B.”

ينسب هذا الأداء الفائق إلى التنفيذ الفعال لنموذج مكافأة خاص بالرياضيات خلال عملية التطوير.

وعلاوة على ذلك، أظهر Qwen2-Math نتائج رائعة في مسابقات رياضية صعبة مثل امتحان الرياضيات الأمريكي (AIME) لعام 2024 ومسابقة الرياضيات الأمريكية (AMC) لعام 2023.

ولضمان سلامة النموذج ومنع التلوث، نفذ فريق Qwen أساليب تنقية قوية خلال مرحلتي ما قبل التدريب وما بعد التدريب. شمل هذا النهج الصارم إزالة العينات المكررة وتحديد التداخلات مع مجموعات الاختبار للحفاظ على دقة النموذج وموثوقيته.

وإلى الأمام، يخطط فريق Qwen لتوسيع قدرات Qwen2-Math إلى ما هو أبعد من اللغة الإنجليزية، مع نماذج ثنائية اللغة ومتعددة اللغات قيد التطوير. يهدف هذا الالتزام بالشمولية إلى جعل حل المشكلات الرياضية المتقدمة متاحًا لجمهور عالمي.

وأكد فريق Qwen: “سنواصل تحسين قدرة نماذجنا على حل المشكلات الرياضية المعقدة والتحديات.”

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى