دراسة تسلط الضوء على تأثير التركيبة السكانية على تدريب الذكاء الاصطناعي
منصة الذكاء الاصطناعي – متابعات
كشفت دراسة بجامعة ميشيغان الأمريكية عن تأثير مهم للتركيبة السكانية في تطوير وتدريب نماذج الذكاء الاصطناعي.
تناولت الدراسة تأثير العوامل الديموغرافية مثل العمر والعرق والتعليم على بيانات تدريب نماذج الذكاء الاصطناعي، كما ركزت على تحليل المخاطر المرتبطة بالتحيزات الموجودة في أنظمة الذكاء الاصطناعي.
وأكد البروفيسور المساعد ديفيد يورجنز من كلية المعلومات بجامعة ميشيغان أن أنظمة مثل تشاتجت يتم استخدامها بشكل متزايد في المهام اليومية، ولكن هل نحن نضمن التنوع في البيانات التدريبية؟ إذا استمرينا في التركيز على عينات غير متنوعة، فإننا سنستمر في إهمال فئات معينة من الناس.
تعتمد أنظمة التعلم الآلي والذكاء الاصطناعي بشكل متزايد على التعليقات التوضيحية البشرية لتحسين أدائها، وهذه العملية تشمل مراجعة وتصنيف مخرجات نماذج اللغة لتحسين أدائها.
أظهرت الدراسة أن التركيبة السكانية لها تأثير كبير على وضع العلامات الهجومية في التعليقات، حيث وجد أن المجموعات العرقية المختلفة تمتلك تصورات مختلفة للهجوم في التعليقات على الإنترنت. بالإضافة إلى ذلك، لعب العمر دورًا في تقييم الهجوم، حيث كان المشاركون الأكبر سناً أكثر عرضة لتصنيف التعليقات على أنها مسيئة.
تضمنت الدراسة تحليل 45,000 تعليق توضيحي يشملون مجموعة واسعة من المهام، مثل اكتشاف الهجوم والإجابة على الأسئلة والأدب. وأظهرت النتائج أن العوامل الديموغرافية لا تزال تؤثر حتى على المهام الموضوعية مثل الإجابة على الأسئلة، حيث تأثرت دقة الإجابة بعوامل مثل العرق والعمر وتعكس التفاوتات في التركيبة السكانية الموجودة في البيانات التدريبية.
واستنتج الباحثون أن هذه النتائج تشير إلى ضرورة زيادة التنوع في بيانات التدريب لنماذج الذكاء الاصطناعي، وتعزيز المساواة والعدالة في تطوير هذه التقنيات. كما أوصوا بضرورة تضمين مجتمعات متنوعة في عمليات التعليق والتصنيف لتحقيق تمثيل أفضل وتعدد وجهات النظر.
هذه الدراسة تسلط الضوء على أهمية التركيبة السكانية والتنوع في تدريب الذكاء الاصطناعي. فهي تذكرنا بأن التحيز والتمييز يمكن أن ينعكسان في نماذج الذكاء الاصطناعي إذا لم يتم تدريبها بشكل صحيح. وبالتالي، يتعين على الباحثين والمهنيين ومطوري الذكاء الاصطناعي العمل على تعزيز التنوع والتمثيل العادل في بيانات التدريب وعمليات التصنيف والتحسين لضمان أن تكون تلك النظم عادلة ومتنوعة وموثوقة.
هذا المحتوي بمعرفة وحدة الذكاء الاصطناعي