
محرر الخبر: منصة الذكاء الاصطناعي – متابعات
كشف فريق البحث في شركة ميتا عن نموذج سيملس إم 4 تي، وهو نموذج متعدد اللغات ومتعدد المهام يهدف إلى تسهيل الترجمة والنسخ السلسة عبر الكلام والنص. يعكس هذا الإعلان التقدم الذي تحقق في مجال التكنولوجيا وتوسيع إمكانية الوصول إلى المحتوى متعدد اللغات على الإنترنت والأجهزة المحمولة ووسائل التواصل الاجتماعي ومنصات الاتصال.
يضم نموذج سيملس إم 4 تي مجموعة مذهلة من القدرات، بما في ذلك التعرف التلقائي على الكلام لما يقرب من 100 لغة، وترجمة الكلام إلى نص تدعم ما يقرب من 100 لغة إدخال وإخراج، وترجمة الكلام إلى كلام لما يقرب من 100 لغة إدخال و 35 لغة إخراج (بما في ذلك الإنجليزية)، وترجمة النص إلى نص لما يقرب من 100 لغة، وترجمة النص إلى كلام لما يقرب من 100 لغة إدخال و 35 لغة إخراج (بما في ذلك الإنجليزية).
يتم توفير سيملس إم 4 تي للباحثين والمطورين بموجب ترخيص سي سي بي-إن سي 4.0، الذي يعكس روح العلوم المفتوحة ويمكّن من استخدام النموذج في مختلف المشاريع والتطبيقات.
بالإضافة إلى ذلك، تم إصدار البيانات الوصفية لسيملسلاين، وهي أكبر مجموعة بيانات ترجمة متعددة الوسائط التي تم جمعها على الإطلاق، وتتألف من 270,000 ساعة من محاذاة الكلام والنص المرتبط. يوفر ذلك فرصًا لاستخراج بيانات مستقلة وإجراء مزيد من البحوث داخل المجتمع.
تطوير سيملس إم 4 تي يواجه تحديات طويلة الأمد في مجال الاتصال متعدد اللغات. وبدلاً من الأنظمة السابقة التي كانت تعتمد على التغطية اللغوية المحدودة واعتماد أنظمة فرعية منفصلة، يقدم سيملس إم 4 تي نموذجاً متكاملاً يتعامل بشكل شامل مع مهام ترجمة الكلام إلى كلام. يتميز هذا النموذج بقدرات متعددة وشاملة في مجال الترجمة والنسخ، ويعد تقدمًا هامًا في مجال التكنولوجيا وتوسيع إمكانية الوصول إلى المحتوى متعدد اللغات. يمكن استخدام نموذج سيملس إم 4 تي في ترجمة الكلام إلى النص والنص إلى النص بين مجموعة كبيرة من اللغات. كما يدعم ترجمة الكلام إلى الكلام لعدد محدود من اللغات.
يتيح سيملس إم 4 تي للباحثين والمطورين استخدامه في مشاريعهم وتطبيقاتهم بموجب ترخيص سي سي بي-إن سي 4.0. ويتميز هذا الترخيص بأنه يشجع على العلم المفتوح ويمكن من استخدام النموذج في مجموعة متنوعة من المجالات.
بالإضافة إلى ذلك، تم إصدار مجموعة بيانات وصفية ضخمة تسمى سيملسلاين، والتي تعد أكبر مجموعة بيانات للترجمة المتعددة الوسائط التي تم جمعها حتى الآن. تضم هذه المجموعة بيانات محاذاة الكلام والنص، وتوفر فرصًا للاستفادة منها في البحث وتطوير التقنيات ذات الصلة.
يعد تطوير سيملس إم 4 تي تحديًا طويل الأمد في مجال الاتصال متعدد اللغات. ومقارنةً بالأنظمة السابقة، يعتبر سيملس إم 4 تي نموذجًا متكاملاً يعالج بشكل شامل مهام الترجمة والنسخ بين اللغات المختلفة.
هذا المحتوي بمعرفة وحدة الذكاء الاصطناعي