تقنيات الذكاء الاصطناعي الجديدة لشركة ميتا تتيح معالجة متعددة الوسائط وتوليد الموسيقى والمزيد
بوابة الذكاء الاصطناعي - وحدة المتابعة
ميتا تكشف عن خمسة نماذج رئيسية جديدة للذكاء الاصطناعي والأبحاث، بما في ذلك أنظمة متعددة الوسائط قادرة على معالجة النص والصور معًا، ونماذج لغوية متطورة، وتوليد الموسيقى، والكشف عن الكلام المُولد آليًا، وجهود لتحسين التنوع في أنظمة الذكاء الاصطناعي.
تأتي هذه الإصدارات من فريق البحوث الأساسية للذكاء الاصطناعي (FAIR) في ميتا، والذي ركز على تعزيز الذكاء الاصطناعي من خلال البحث والتعاون المفتوح على مدى أكثر من عقد. وبينما يبتكر الذكاء الاصطناعي بسرعة، تعتقد ميتا أن العمل مع المجتمع العالمي أمر حاسم.
“من خلال مشاركة هذا البحث علنًا، نأمل في إلهام تطويرات جديدة والمساعدة في تقدم الذكاء الاصطناعي بطريقة مسؤولة”، كما قالت ميتا.
وتشمل الإصدارات مكونات رئيسية من طرازات “كاميليون” التابعة لميتا بموجب ترخيص بحثي. وكاميليون هي عائلة من النماذج متعددة الوسائط القادرة على فهم وإنشاء النص والصور في الوقت نفسه – على خلاف معظم نماذج اللغة الضخمة التي تكون عادة أحادية الوسائط.
وتم أيضًا إصدار نماذج مدربة مسبقًا لإكمال الشفرة البرمجية باستخدام “التنبؤ متعدد الرموز” بموجب ترخيص بحثي غير تجاري. كما طورت ميتا نموذج JASCO لتوليد مقاطع موسيقية من النص مع توفير المزيد من التحكم.
وأطلقت ميتا أيضًا نظام “AudioSeal” الذي يعد أول نظام للبصمة الصوتية مصمم للكشف عن الكلام المُولد آليًا. كما عملت الشركة على تحسين تنوع نماذج تحويل النص إلى صورة.
وتأمل ميتا أن تؤدي مشاركة هذه النماذج الرائدة إلى تعزيز التعاون ودفع الابتكار داخل مجتمع الذكاء الاصطناعي.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي