Google araştırmacıları tarafından geliştirilen bu dil modeli, hastalıkları teşhis etme ve empati kurma konularında doktorlardan daha üstün bir performans gösterdi.
Articulate Medical Intelligence Explorer (AMIE) adlı bu model, hastalarla gerçekleştirilen görüşmelerde doktorları geçti ve hem teşhis konusunda hem de empati kurma yeteneğinde daha başarılı oldu.
AMIE’nin hastalarla yapılan simülasyon görüşmelerinde, doktorlarla benzer bir miktarda bilgi edinebildiği ve daha iyi empati kurabildiği tespit edildi. Ancak, modelin henüz gerçek hastalar üzerinde test edilmediği ve sadece aktörlerin kullanıldığı simülasyonlarda başarı gösterdiği vurgulanıyor. Araştırmacılar, modelin deneysel olduğunu ve daha fazla araştırma ve testin gerekliliğini ifade ediyorlar.
Araştırmada, 20 oyuncu tarafından 149 farklı klinik senaryo simüle edildi. Görüşmeler metin tabanlı olarak gerçekleştirildi, yüz yüze değildi. Oyuncular, görüşmeler sırasında gerçek doktorlarla mı yoksa sohbet botuyla mı konuştuklarını bilmiyordu.
Bir grup uzman, AMIE (Articulate Medical Intelligence Explorer) adlı sohbet botunun ve gerçek doktorların performansını değerlendirdi. Çalışma sonuçlarına göre, nezaket, durumu ve tedaviyi açıklama, dürüst görünme, teşhis gibi kriterler üzerinden yapılan değerlendirmede sohbet botunun 26 kriterin 24’ünde doktorları geçtiği görüldü.
AMIE’nin doktorlardan daha iyi sonuçlar alması, yapay zekânın doktorların yerini alacağı anlamına gelmiyor. Google araştırmacısı Alan Karthikesalingam, “Bu, hiçbir şekilde bir dil modelinin tıbbi görüşmelerde doktorlardan daha iyi olduğu anlamına gelmez” dedi.
Aynı konuda Harvard’da doktor olarak görev yapan Adam Rodman da aracın faydalı olabileceğini, ancak tıbbın sadece bilgi toplamaktan ibaret olmadığını ve tamamen insan ilişkileriyle alakalı olduğunu belirtti.
Araştırmada yer alan bir diğer önemli nokta, katılan doktorların bu tür metin tabanlı görüşmelere alışık olmamaları ve bu durumun performanslarını etkileyebileceği. Bu nedenle yapay zekânın öne geçmesine dair elde edilen sonuçların, doktorların geleneksel yöntemlere alışık olmamaları bağlamında bir perspektif içerdiği ifade ediliyor.
Ancak çalışma, yapay zekânın empati kurabilen ve hastanın geçmişinden yola çıkarak tanı koyabilen bir doktor benzeri performans sergileme potansiyeline işaret ediyor.
Araştırmacılar, bu potansiyeli daha ayrıntılı bir şekilde değerlendirmek, potansiyel ön yargıları anlamak ve sistemlerinin farklı popülasyonlarda benzer sonuçlar vermesini sağlamak için daha kapsamlı çalışmaların yapılması gerektiğini vurguluyor.



ENFIELD
HACKNEY
HARINGEY
ISLINGTON










