دراسة صادمة: الذكاء الاصطناعي لا يزال غير آمن للاستخدام الطبي السريري

كشفت دراسة علمية حديثة عن محدودية قدرات الذكاء الاصطناعي التوليدي في بيئات الرعاية الصحية، مؤكدة أنه رغم التطور الكبير في روبوتات الدردشة الطبية، فإنها لا تزال غير قادرة على أداء مهام الاستدلال السريري بالشكل الذي يضمن استخدامها الآمن داخل الممارسات الطبية اليومية.

دقة تشخيصية مرتفعة… لكن خلل خطير في التفكير الطبي

أوضحت الدراسة أن نماذج الذكاء الاصطناعي تحسن من أدائها التشخيصي عند تزويدها ببيانات سريرية كاملة، إلا أنها تفشل في بناء التشخيص التفريقي في أكثر من 80% من الحالات، وهو ما يعد نقطة جوهرية في عملية اتخاذ القرار الطبي.

وأجرى البحث فريق من مستشفى ماساتشوستس العام بريجهام في بوسطن، وهو أحد أكبر أنظمة الرعاية الصحية البحثية في الولايات المتحدة، حيث تم تقييم أداء مجموعة واسعة من نماذج الذكاء الاصطناعي في سيناريوهات طبية واقعية.

اختبار شامل لنماذج الذكاء الاصطناعي الكبرى

شملت الدراسة تحليل 21 نموذجًا من أبرز أنظمة الذكاء الاصطناعي التوليدي، بما في ذلك ChatGPT وClaude وGemini وDeepSeek وGrok، وذلك عبر 29 حالة سريرية معيارية باستخدام أداة تقييم متخصصة تحمل اسم PrIME LLM.

وتم اختبار قدرات هذه النماذج في عدة مراحل من التفكير الطبي، تشمل وضع التشخيص الأولي، وطلب الفحوصات، والتوصل إلى التشخيص النهائي، ووضع خطة العلاج.

الذكاء الاصطناعي ينجح في النتيجة النهائية ويفشل في المنطق الطبي

أظهرت النتائج أن النماذج تحقق أداءً جيدًا في الوصول إلى التشخيص النهائي عند توفر المعلومات الكاملة، حيث تراوحت نسب النجاح بين 60% وأكثر من 90% حسب النموذج المستخدم.

لكن في المقابل، سجلت جميع النماذج فشلًا في تقديم تشخيص تفريقي مناسب في أكثر من 80% من الحالات، وهو ما يكشف ضعفًا واضحًا في مرحلة التفكير الطبي المبكر، خصوصًا عند التعامل مع حالات غير مكتملة المعلومات.

تحذيرات من استخدام غير خاضع للإشراف الطبي

حذر الباحث مارك سوتشي من الاعتماد على هذه النماذج في الممارسة السريرية دون إشراف طبي مباشر، مؤكدًا أن الذكاء الاصطناعي، رغم تقدمه، لا يزال غير مؤهل لمحاكاة ما يعرف بـ”فن الطب”، وهو القدرة على التفكير التشخيصي المعقد في ظل عدم اليقين.

كما أشارت الدراسة إلى أن النماذج قد تتأثر بمعلومات طبية غير دقيقة متاحة عبر الإنترنت، ما قد يؤدي إلى أخطاء في الاستنتاجات الطبية إذا تم استخدامها دون رقابة.

خلاصة علمية: أداة مساعدة وليست بديلًا للطبيب

خلص الباحثون إلى أن الذكاء الاصطناعي التوليدي يمكن أن يكون أداة داعمة قوية في المجال الطبي، لكنه لا يزال بعيدًا عن أن يكون بديلًا آمنًا للأطباء، خاصة في المراحل الأولى من التشخيص التي تعتمد على التحليل المنطقي المعقد.