أدوات إبداعيةبرامج وتطبيقات

تقنية الذكاء الاصطناعي تولد صوراً عالية الجودة بمعدل 30 مرة أسرع في خطوة واحدة

بوابة الذكاء الاصطناعي - وحدة المتابعة

يمكن للحواسيب، في عصر الذكاء الاصطناعي، توليد “فن” خاص بها من خلال نماذج الانتشار، حيث يتم إضافة هيكلية تدريجية لحالة أولية ضجيجية حتى يظهر صورة أو فيديو واضح. وقد لاقت نماذج الانتشار رواجًا حديثًا في كل مكان: حيث يكفي إدخال بضع كلمات وتجربة لحظات فورية من الحلم تحفز إفراز الدوبامين عند تلاقي الواقع والخيال. وراء الكواليس، يتضمن هذا الأمر عملية معقدة وتستغرق وقتًا طويلاً تتطلب العديد من التكرارات حتى يتمكن الخوارزمية من تحسين الصورة بشكل مثالي.

قدم باحثو مختبر علوم الحاسوب والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا (CSAIL) تصورًا جديدًا يُبسط عملية النماذج التقليدية للانتشار المتعدد الخطوات إلى خطوة واحدة، متجاوزين القيود السابقة. يتم ذلك من خلال نوع من نموذج المدرسة والطالب: حيث يتم تعليم نموذج حاسوب جديد لتقليد سلوك النماذج الأصلية الأكثر تعقيدًا التي تولد الصور. وهذا النهج، المعروف باسم استخلاص مطابقة التوزيع (DMD)، يحافظ على جودة الصور المولدة ويتيح توليد أسرع بكثير.

يقول تيانوي يين، طالب الدكتوراه في هندسة الكهرباء والعلوم الحاسوبية في MIT وعضو CSAIL والباحث الرئيسي في إطار DMD: “عملنا هو طريقة جديدة تسرع النماذج الحالية للانتشار مثل الانتشار المستقر و DALLE-3 بمعدل 30 مرة”. “هذا التقدم ليس فقط يقلل بشكل كبير من الوقت الحسابي، بل يحتفظ، إن لم يتفوق، على جودة المحتوى المرئي المولد. من الناحية النظرية، يجمع هذا النهج بين مبادئ الشبكات المولدة للمنافسة (GANs) ونماذج الانتشار، محققًا توليد محتوى مرئي في خطوة واحدة.

تعمل تقنية استخلاص مطابقة التوزيع (DMD) من خلال تدريب نموذج حاسوب على تقليد سلوك النماذج الأصلية التي تنتج الصور عالية الجودة. يتم تدريب النموذج الجديد على مجموعة كبيرة من الصور ويتعلم توزيع البيانات الإحصائية للصور الأصلية. بعد التدريب، يمكن للنموذج الجديد توليد صور جديدة عن طريق توليد عينات من التوزيع الإحصائي الذي تعلمه.

تم تطبيق تقنية DMD على نماذج الانتشار المستقرة (VQ-VAE) ونماذج أخرى متقدمة مثل DALLE-3. أظهرت النتائج أن التقنية تتمتع بقدرة كبيرة على توليد صور ذات جودة عالية في وقت قصير. بالإضافة إلى ذلك، يمكن للتقنية أيضًا توليد صور متنوعة ومبتكرة بناءً على التوزيع الإحصائي الذي تعلمه.

يعتبر تقدم تقنية DMD في مجال توليد الصور بشكل أسرع وبجودة عالية خطوة هامة في تطوير تقنيات الذكاء الاصطناعي. يمكن أن يجد هذا التطبيقات مثل إنتاج الصور والرسوم المتحركة على نطاق واسع، بالإضافة إلى التطبيقات في مجالات مثل التصميم والإبداع الفني.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى