ابتكارات وابداعاتبوت وروبوت

أداة ذكاء اصطناعي جديدة تُساعد الأطباء على تحليل الصور الطبية بشكل أسرع وأكثر دقة

بوابة الذكاء الاصطناعي - وحدة المتابعة

تُظهر الصور الطبية، مثل التصوير بالرنين المغناطيسي أو الأشعة السينية، مجموعة غامضة من البقع السوداء والبيضاء للعين غير المدربة. قد يكون من الصعب للغاية فك رموز مكان انتهاء هيكل واحد (مثل الورم) وبدء هيكل آخر.

عندما يتم تدريب أنظمة الذكاء الاصطناعي على فهم حدود الهياكل البيولوجية، يمكنها تقسيم (أو تحديد) مناطق الاهتمام التي يرغب الأطباء والعاملون في المجال الطبي في مراقبتها بحثًا عن الأمراض وغيرها من التشوهات. بدلاً من إضاعة الوقت الثمين في تتبع التشريح يدويًا عبر العديد من الصور، يمكن لمساعد اصطناعي القيام بذلك نيابة عنهم.

لكن المشكلة هي أن الباحثين والأطباء يجب أن يقوموا بوضع علامات على عدد لا يحصى من الصور لتدريب نظام الذكاء الاصطناعي الخاص بهم قبل أن يتمكن من التقسيم بدقة. على سبيل المثال، ستحتاج إلى وضع علامات على القشرة الدماغية في العديد من عمليات مسح الرنين المغناطيسي لتدريب نموذج مُشرف على فهم كيفية اختلاف شكل القشرة في أدمغة مختلفة.

للتغلب على هذه عملية جمع البيانات المرهقة، طور باحثون من مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) في معهد ماساتشوستس للتكنولوجيا، ومستشفى ماساتشوستس العام (MGH)، وكلية الطب بجامعة هارفارد إطار عمل “ScribblePrompt” التفاعلي: أداة مرنة يمكن أن تساعد في تقسيم أي صورة طبية بسرعة، حتى الأنواع التي لم تشاهدها من قبل.

بدلاً من مطالبة البشر بوضع علامات على كل صورة يدويًا، قام الفريق بمحاكاة كيفية قيام المستخدمين بوضع علامات على أكثر من 50000 عملية مسح، بما في ذلك التصوير بالرنين المغناطيسي، والموجات فوق الصوتية، والصور الفوتوغرافية، عبر الهياكل في العينين، والخلايا، والأدمغة، والعظام، والجلد، والمزيد. لوضع علامات على جميع عمليات المسح هذه، استخدم الفريق خوارزميات لمحاكاة كيفية قيام البشر بخربشة والنقر على مناطق مختلفة في الصور الطبية. بالإضافة إلى المناطق المحددة بشكل شائع، استخدم الفريق أيضًا خوارزميات “superpixel” ، التي تجد أجزاء من الصورة ذات قيم متشابهة، لتحديد مناطق اهتمام جديدة محتملة للباحثين الطبيين وتدريب ScribblePrompt على تقسيمها. ساعدت هذه البيانات الاصطناعية ScribblePrompt على التعامل مع طلبات التقسيم من العالم الحقيقي من قبل المستخدمين.

تقول هالي وونغ، طالبة الدكتوراه في معهد ماساتشوستس للتكنولوجيا والمؤلفة الرئيسية في ورقة بحثية جديدة حول ScribblePrompt، وهي أيضًا تابعة لمختبر CSAIL: “للذكاء الاصطناعي إمكانات كبيرة في تحليل الصور والبيانات عالية الأبعاد الأخرى لمساعدة البشر على القيام بالأشياء بشكل أكثر إنتاجية. نريد أن نُكمل، وليس أن نستبدل، جهود العاملين في المجال الطبي من خلال نظام تفاعلي. ScribblePrompt هو نموذج بسيط مع كفاءة لمساعدة الأطباء على التركيز على الأجزاء الأكثر إثارة للاهتمام من تحليلهم. إنه أسرع وأكثر دقة من طرق التقسيم التفاعلية المماثلة، مما يقلل من وقت وضع العلامات بنسبة 28٪ مقارنةً بإطار عمل Segment Anything Model (SAM) من Meta، على سبيل المثال.”

واجهة ScribblePrompt بسيطة: يمكن للمستخدمين الخربشة عبر المنطقة التقريبية التي يرغبون في تقسيمها، أو النقر عليها، وستقوم الأداة بتمييز الهيكل بأكمله أو الخلفية حسب الطلب. على سبيل المثال، يمكنك النقر على الأوردة الفردية داخل مسح شبكية العين. يمكن لـ ScribblePrompt أيضًا وضع علامات على هيكل معين باستخدام مربع حدود.

ثم يمكن للأداة إجراء تصحيحات بناءً على ملاحظات المستخدم. إذا كنت ترغب في تمييز الكلى في الموجات فوق الصوتية، فيمكنك استخدام مربع حدود، ثم الخربشة في أجزاء إضافية من الهيكل إذا فات ScribblePrompt أي حواف. إذا كنت ترغب في تحرير الجزء الخاص بك، فيمكنك استخدام “خربشة سلبية” لاستبعاد مناطق معينة.

جعلت هذه القدرات التفاعلية ذاتية التصحيح ScribblePrompt الأداة المفضلة بين باحثي التصوير العصبي في MGH في دراسة المستخدمين. فضل 93.8٪ من هؤلاء المستخدمين نهج معهد ماساتشوستس للتكنولوجيا على خط الأساس SAM في تحسين أجزائه استجابةً لتصحيحات الخربشة. أما بالنسبة للتنقيحات القائمة على النقر، فقد فضل 87.5٪ من الباحثين الطبيين ScribblePrompt.

تم تدريب ScribblePrompt على خربشات ونقرات محاكاة على 54000 صورة عبر 65 مجموعة بيانات، تضمنت عمليات مسح للعينين، والصدر، والعمود الفقري، والخلايا، والجلد، وعضلات البطن، والرقبة، والدماغ، والعظام، والأسنان، والآفات. تعرفت النموذج على 16 نوعًا من الصور الطبية، بما في ذلك المجاهر، ومسح التصوير المقطعي المحوسب، والأشعة السينية، والتصوير بالرنين المغناطيسي، والموجات فوق الصوتية، والصور الفوتوغرافية.

تقول وونغ: “لا تستجيب العديد من الطرق الحالية بشكل جيد عندما يقوم المستخدمون بخربشة عبر الصور لأن من الصعب محاكاة مثل هذه التفاعلات في التدريب. بالنسبة لـ ScribblePrompt، تمكنا من إجبار نموذجنا على الانتباه إلى مدخلات مختلفة باستخدام مهام التقسيم الاصطناعية الخاصة بنا. أردنا تدريب ما هو في الأساس نموذج أساسي على الكثير من البيانات المتنوعة بحيث يعمم على أنواع جديدة من الصور والمهام.”

بعد تلقي الكثير من البيانات، قام الفريق بتقييم ScribblePrompt عبر 12 مجموعة بيانات جديدة. على الرغم من أنه لم ير هذه الصور من قبل، فقد تفوق على أربع طرق موجودة من خلال التقسيم بشكل أكثر كفاءة وإعطاء تنبؤات أكثر دقة حول المناطق الدقيقة التي يرغب المستخدمون في تمييزها.

يقول أدريان دالكا، المؤلف الرئيسي ورئيس قسم البحث في مختبر CSAIL وأستاذ مساعد في MGH وكلية الطب بجامعة هارفارد: “التقسيم هو أكثر مهام تحليل الصور الطبية شيوعًا، والتي يتم إجراؤها على نطاق واسع في الممارسة السريرية الروتينية وفي البحث – مما يؤدي إلى كونها متنوعة للغاية وخطوة حاسمة ذات تأثير كبير. تم تصميم ScribblePrompt بعناية ليكون مفيدًا عمليًا للأطباء والباحثين، وبالتالي لجعل هذه الخطوة أسرع بكثير.”

يقول بروفيسور علم الأشعة في كلية الطب بجامعة هارفارد وعالم الأعصاب في MGH، بروس فيشيل، الذي لم يشارك في الورقة البحثية: “تعتمد غالبية خوارزميات التقسيم التي تم تطويرها في تحليل الصور والتعلم الآلي على قدرتنا على وضع علامات يدوية على الصور. المشكلة أسوأ بكثير في التصوير الطبي حيث تكون “صورنا” عادةً مجلدات ثلاثية الأبعاد، حيث لا يوجد لدى البشر أي سبب تطور أو ظاهري لامتلاك أي كفاءة في وضع علامات على الصور ثلاثية الأبعاد. يمكّن ScribblePrompt من إجراء وضع العلامات اليدوية بشكل أسرع بكثير وأكثر دقة، من خلال تدريب شبكة على أنواع التفاعلات التي قد يكون لدى الإنسان عادةً مع صورة أثناء وضع علامات يدوية. والنتيجة هي واجهة بديهية تسمح للمُعلّمين بالتفاعل بشكل طبيعي مع بيانات التصوير بإنتاجية أكبر بكثير مما كان ممكنًا سابقًا.”

كتب وونغ ودالكا الورقة البحثية مع اثنين آخرين من أعضاء مختبر CSAIL: جون جوتاج، أستاذ EECS في معهد ماساتشوستس للتكنولوجيا وباحث رئيسي في مختبر CSAIL. ومارين راكيت، طالبة الدكتوراه في معهد ماساتشوستس للتكنولوجيا. تم دعم عملهم جزئيًا من قبل Quanta Computer Inc.، ومركز إريك وويندي شميت في معهد Broad، و Wistron Corp.، والمعهد الوطني للتصوير الحيوي والهندسة الحيوية في المعاهد الوطنية للصحة، مع دعم الأجهزة من مركز ماساتشوستس للعلوم الحيوية.

سيتم تقديم عمل وونغ وزملائها في مؤتمر الرؤية الحاسوبية الأوروبي لعام 2024، وتم تقديمه كمحاضرة شفهية في ورشة عمل DCAMI في مؤتمر الرؤية الحاسوبية وأنماط التعرف في وقت سابق من هذا العام. حصلوا على جائزة “Bench-to-Bedside Paper Award” في ورشة العمل لـ ScribblePrompt’s تأثيرها السريري المحتمل.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى