صناعة وابتكار

لغز في غرفة الطوارئ؟ اسأل دكتور Chatbot عن التشخيص.


كانت المريضة امرأة تبلغ من العمر 39 عامًا جاءت إلى قسم الطوارئ في مركز Beth Israel Deaconess الطبي في بوسطن. كانت ركبتها اليسرى تؤلمها لعدة أيام. في اليوم السابق ، أصيبت بحمى 102 درجة. لقد ذهب الآن ، لكنها ما زالت تعاني من قشعريرة. وكانت ركبتها حمراء ومنتفخة.

ماذا كان التشخيص؟

في يوم جمعة مشبع بالبخار مؤخرًا ، عرضت الدكتورة ميغان لاندون ، طبيبة مقيمة ، هذه الحالة الحقيقية على غرفة مليئة بطلاب الطب والمقيمين. لقد اجتمعوا لتعلم مهارة يمكن أن يكون تعليمها صعبًا – كيف يفكر مثل الطبيب.

قال الدكتور آدم رودمان ، طبيب باطني ، ومؤرخ طبي ومنظم الحدث في Beth Israel Deaconess: “الأطباء سيئون في تعليم الأطباء الآخرين كيف نفكر”.

لكن هذه المرة ، يمكنهم الاتصال بخبير للمساعدة في الوصول إلى التشخيص – GPT-4 ، أحدث إصدار من chatbot الذي أصدرته شركة OpenAI.

يعمل الذكاء الاصطناعي على تغيير العديد من جوانب ممارسة الطب ، ويستخدم بعض المهنيين الطبيين هذه الأدوات لمساعدتهم في التشخيص. قرر الأطباء في Beth Israel Deaconess ، وهو مستشفى تعليمي تابع لكلية الطب بجامعة هارفارد ، استكشاف كيفية استخدام روبوتات المحادثة – وإساءة استخدامها – في تدريب أطباء المستقبل.

يأمل المدرسون مثل دكتور رودمان أن يتمكن طلاب الطب من اللجوء إلى GPT-4 وروبوتات المحادثة الأخرى لشيء مشابه لما يسميه الأطباء استشارة الرصيف – عندما يسحبون زميلًا جانبًا ويسألون عن رأي حول حالة صعبة. الفكرة هي استخدام chatbot بنفس الطريقة التي يتعامل بها الأطباء مع بعضهم البعض للحصول على الاقتراحات والأفكار.

لأكثر من قرن من الزمان ، تم تصوير الطبيب على أنه محقق يجمع الأدلة ويستخدمها للعثور على الجاني. لكن الأطباء المتمرسين يستخدمون في الواقع طريقة مختلفة – التعرف على الأنماط – لمعرفة الخطأ. في الطب ، يُسمى هذا البرنامج النصي للمرض: العلامات والأعراض ونتائج الاختبارات التي جمعها الأطباء لإخبار قصة متماسكة بناءً على حالات مماثلة يعرفون عنها أو رأوها بأنفسهم.

قال الدكتور رودمان إنه إذا لم يساعد نص المرض ، فإن الأطباء يلجأون إلى استراتيجيات أخرى ، مثل تحديد الاحتمالات لتشخيصات مختلفة قد تكون مناسبة.

حاول الباحثون منذ أكثر من نصف قرن تصميم برامج كمبيوتر لإجراء التشخيصات الطبية ، لكن لم ينجح أي شيء حقًا.

يقول الأطباء أن GPT-4 مختلف. قال الدكتور رودمان: “سيخلق شيئًا مشابهًا بشكل ملحوظ لسيناريو المرض”. وأضاف أنه بهذه الطريقة “يختلف اختلافًا جوهريًا عن محرك البحث”.

قام الدكتور رودمان وأطباء آخرون في Beth Israel Deaconess بسؤال GPT-4 عن التشخيصات المحتملة في الحالات الصعبة. في دراسة صدرت الشهر الماضي في المجلة الطبية JAMA ، وجدوا أن أداءها أفضل من معظم الأطباء في تحديات التشخيص الأسبوعية المنشورة في New England Journal of Medicine.

لكنهم تعلموا أن هناك فنًا لاستخدام البرنامج ، وهناك عيوب.

قال الدكتور كريستوفر سميث ، مدير برنامج الإقامة في الطب الباطني في المركز الطبي ، إن طلاب الطب والمقيمين “يستخدمونه بالتأكيد”. لكنه أضاف ، “ما إذا كانوا يتعلمون أي شيء هو سؤال مفتوح”.

القلق هو أنهم قد يعتمدون على الذكاء الاصطناعي لإجراء التشخيص بنفس الطريقة التي يعتمدون بها على الآلة الحاسبة على هواتفهم لحل مشكلة حسابية. قال الدكتور سميث ، هذا أمر خطير.

قال إن التعلم يتضمن محاولة اكتشاف الأشياء: “هذه هي الطريقة التي نحتفظ بها بالأشياء. النضال هو جزء من التعلم. إذا قمت بالاستعانة بمصادر خارجية لتعلم GPT ، فإن هذا الصراع قد انتهى “.

في الاجتماع ، انقسم الطلاب والمقيمون إلى مجموعات وحاولوا معرفة الخطأ في المريض المصاب بالركبة المتورمة. ثم تحولوا إلى GPT-4.

جربت المجموعات أساليب مختلفة.

استخدم أحدهم GPT-4 لإجراء بحث على الإنترنت ، على غرار الطريقة التي يستخدم بها Google. قام الشات بوت ببصق قائمة من التشخيصات المحتملة ، بما في ذلك الصدمة. ولكن عندما طلب منها أعضاء المجموعة شرح أسبابها ، كان الروبوت مخيبًا للآمال ، موضحًا اختياره بالقول: “الصدمة هي سبب شائع لإصابة الركبة”.

فكرت مجموعة أخرى في فرضيات محتملة وطلبت من GPT-4 التحقق منها. اصطفت قائمة روبوت الدردشة مع قائمة المجموعة: العدوى ، بما في ذلك داء لايم ؛ التهاب المفاصل ، بما في ذلك النقرس ، وهو نوع من التهاب المفاصل يتضمن بلورات في المفاصل ؛ والصدمة.

أضاف GPT-4 التهاب المفاصل الروماتويدي إلى أعلى الاحتمالات ، على الرغم من أنه لم يكن على رأس قائمة المجموعة. قال المدربون للمجموعة لاحقًا إن النقرس غير محتمل بالنسبة لهذه المريضة لأنها كانت شابة وأنثى. وربما يمكن استبعاد التهاب المفاصل الروماتويدي بسبب التهاب مفصل واحد فقط ولمدة يومين فقط.

كمستشار على الرصيف ، بدا أن GPT-4 اجتاز الاختبار أو على الأقل الاتفاق مع الطلاب والمقيمين. لكن في هذا التمرين ، لم يقدم أي رؤى ، ولا سيناريو مرض.

قد يكون أحد الأسباب هو أن الطلاب والمقيمين استخدموا الروبوت كمحرك بحث أكثر من كونه استشارة على جانب الرصيف.

لاستخدام الروبوت بشكل صحيح ، قال المدربون ، يجب أن يبدأوا بإخبار GPT-4 بشيء مثل ، “أنت طبيب ترى امرأة تبلغ من العمر 39 عامًا تعاني من آلام في الركبة.” بعد ذلك ، سيحتاجون إلى سرد أعراضها قبل طلب التشخيص والمتابعة بأسئلة حول منطق الروبوت ، بالطريقة التي يفعلونها مع زميل طبي.

قال المدربون إن هذه طريقة لاستغلال قوة GPT-4. ولكن من المهم أيضًا أن ندرك أن روبوتات المحادثة يمكن أن ترتكب أخطاء و “تهلوس” – تقديم إجابات لا أساس لها في الواقع. يتطلب استخدامه معرفة متى يكون غير صحيح.

قال الدكتور بايرون كرو ، طبيب الباطنة في المستشفى: “ليس من الخطأ استخدام هذه الأدوات”. “عليك فقط استخدامها بالطريقة الصحيحة.”

قدم تشبيهًا للمجموعة.

قال الدكتور كرو: “يستخدم الطيارون نظام تحديد المواقع العالمي (GPS)”. لكنه أضاف أن شركات الطيران “تتمتع بمستوى عالٍ جدًا من الموثوقية”. وقال إن استخدام روبوتات المحادثة في الطب “مغر للغاية” ، لكن يجب تطبيق نفس المعايير العالية.

قال: “إنه شريك فكري رائع ، لكنه لا يحل محل الخبرة العقلية العميقة”.

مع انتهاء الجلسة ، كشف المدربون عن السبب الحقيقي لتورم ركبة المريض.

اتضح أنه احتمال كانت كل مجموعة قد نظرت فيه ، وأن GPT-4 قد اقترحته.

كانت مصابة بمرض لايم.

ساهمت أوليفيا أليسون في إعداد هذا التقرير.


اكتشاف المزيد من نص كم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من نص كم

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading