ابتكارات وابداعاتبوت وروبوت

داتولوجي آي تبني تقنية لتجميع بيانات تدريب الذكاء الاصطناعي بشكل تلقائي

منصة الذكاء الاصطناعي ـ متابعات

تعتبر مجموعات البيانات الضخمة بوابة للنماذج القوية للذكاء الاصطناعي، ولكن في كثير من الأحيان تكون أيضًا سببا لفشل تلك النماذج. فالتحيزات تظهر من نماذج مخفية في الأنماط المسبقة المتعلقة بالعرق أو الجنس أو الثقافة في مجموعات البيانات الكبيرة، مثل صور الرؤساء التنفيذيين البيض في مجموعة تصنيف الصور. ويمكن أن تكون مجموعات البيانات الكبيرة غير منظمة، وتحتوي على الكثير من الضوضاء والمعلومات الزائدة.

في استطلاع أجرته شركة ديلويت الأخير حول الشركات التي تعتمد على الذكاء الاصطناعي، قال 40% من المشاركين إن التحديات المتعلقة بالبيانات – بما في ذلك إعداد وتنظيف البيانات بشكل شامل – كانت من بين أعلى القلق الذي يعرقل مبادرات الذكاء الاصطناعي لديهم. ووجد استطلاع منفصل لعلماء البيانات أن نحو 45% من وقت العلماء يتم قضاؤه على مهام إعداد البيانات، مثل “تحميل” وتنظيف البيانات.

يرغب آري موركوس، الذي عمل في صناعة الذكاء الاصطناعي لمدة تقارب عقدًا من الزمان، في تجاوز العديد من عمليات إعداد البيانات المتعلقة بتدريب نماذج الذكاء الاصطناعي – وقد أسس شركة ناشئة لتحقيق ذلك.

تقوم شركة داتولوجي آي ببناء أدوات لتجميع المجموعات البيانات تلقائيًا، مثل تلك المستخدمة في تدريب ChatGPT من OpenAI و Gemini من Google ونماذج GenAI الأخرى. يزعم موركوس أن المنصة يمكنها تحديد أهمية البيانات اعتمادًا على تطبيق النموذج (مثل كتابة البريد الإلكتروني)، بالإضافة إلى طرق يمكن فيها تعزيز المجموعة ببيانات إضافية وكيفية تجزئة البيانات إلى شرائح أكثر إدارة خلال تدريب النموذج.

هذا المحتوى تم بمعرفة وحدة الذكاء الاصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى