أظهرت دراسة جديدة نُشرت في دورية "نيتشر ميديسن" أن سؤال الذكاء الاصطناعي عن الأعراض الطبية لا يُساعد المرضى على اتخاذ قرارات أفضل بشأن صحتهم مقارنةً بالأساليب الأخرى، كالبحث التقليدي على الإنترنت.
وقال مؤلفو الدراسة إن الدراسة كانت مهمة لأن الناس يتجهون بشكل متزايد إلى الذكاء الاصطناعي وروبوتات الدردشة للحصول على نصائح حول صحتهم، ولكن دون دليل على أن هذا هو النهج الأفضل والأكثر أمانًا بالضرورة.
عمل الباحثون بقيادة معهد الإنترنت بجامعة أكسفورد، بالتعاون مع مجموعة من الأطباء، على وضع عشرة سيناريوهات طبية مختلفة، تتراوح بين نزلات البرد الشائعة والنزيف الدماغي المُهدد للحياة، بحسب "رويترز".
وعند اختبارها بدون مشاركين بشريين، تمكنت ثلاثة نماذج لغوية كبيرة -وهي"GPT-40" من "أوبن إيه آي"، و"لاما 3" من "ميتا"، و"Command R+" من "Cohere"- من تحديد الحالات في 94.9% من الحالات، واختارت الإجراء الصحيح، كاستدعاء سيارة إسعاف أو زيارة الطبيب، في 56.3% من الحالات في المتوسط.
بعد ذلك، استخدم الباحثون 1,298 مشاركًا في بريطانيا لاستخدام الذكاء الاصطناعي، أو الموارد المعتادة لديهم مثل البحث على الإنترنت، أو خبرتهم الشخصية، أو موقع هيئة الخدمات الصحية الوطنية للتحقق من الأعراض واتخاذ القرار المناسب للخطوة التالية.
عندما قام المشاركون بذلك، تم تحديد الحالات ذات الصلة في أقل من 34.5% من الحالات، وتم تقديم العلاج المناسب في أقل من 44.2%، وهو ما لا يختلف عن المجموعة الضابطة التي استخدمت أدوات تقليدية.
قال آدم مهدي، المؤلف المشارك للدراسة والأستاذ المساعد في جامعة أكسفورد، إن الدراسة أظهرت "فجوة هائلة" بين إمكانيات الذكاء الاصطناعي ومخاطر استخدامه من قبل البشر.
وأضاف: "قد تكون المعرفة موجودة في تلك الروبوتات ؛ إلا أن هذه المعرفة لا تترجم دائمًا عند التفاعل مع البشر"، مشيرًا إلى أن هناك حاجة لمزيد من العمل لفهم سبب حدوث ذلك.
درس الفريق حوالي 30 تفاعلًا بالتفصيل، وخلص إلى أن البشر غالبًا ما يقدمون معلومات غير مكتملة أو خاطئة، وأن النماذج اللغوية الكبيرة تُصدر أحيانًا ردودًا مضللة أو غير صحيحة.
على سبيل المثال، أُبلغ مريض بأعراض نزيف تحت العنكبوتية -وهي حالة مُهددة للحياة تُسبب نزيفًا في الدماغ- بشكل صحيح من قِبل الذكاء الاصطناعي بالذهاب إلى المستشفى بعد أن وصف تيبسًا في الرقبة، وحساسية للضوء، و"أسوأ صداع على الإطلاق". بينما وصف مريض آخر الأعراض نفسها ولكن بصداع "فظيع"، ونُصح بالاستلقاء في غرفة مُظلمة.
يُخطط الفريق الآن لإجراء دراسة مُماثلة في بلدان ولغات مُختلفة، وعلى مدى فترة زمنية، لاختبار ما إذا كان ذلك يُؤثر على أداء الذكاء الاصطناعي.
المصدر:
العربيّة