Harvard çalışması: Yapay zeka acil servis teşhislerinde iki doktoru geride bıraktı

Yapay zeka vs. acil servis doktorları
Harvard öncülüğündeki yeni bir çalışma, büyük dil modellerinin bazı acil servis hastalarının teşhisinde insan hekimlerden daha iyi olabileceğini; en azından gerçek klinik vakalar kullanılarak yapılan kontrollü testlerde böyle göründüğünü öne sürüyor.
Bu hafta Science dergisinde yayımlanan araştırma, OpenAI’nin o1 ve 4o modellerinin bir dizi tıbbi ortamda nasıl performans gösterdiğini inceledi; bunların arasında Beth Israel acil servisine başvuran 76 hasta üzerine dayanan bir deney de vardı. Yapay zeka sistemleri iki dahiliye sorumlu hekimiyle kıyaslandı ve sonuçlar, teşhisin bir doktordan mı yoksa bir modelden mi geldiğini bilmeyen iki başka sorumlu hekim tarafından gözden geçirildi.
Araştırmaya göre o1, her teşhis aşamasında “ya iki sorumlu hekim ve 4o’dan nominal olarak daha iyi performans gösterdi ya da onlarla eşdeğerdi.” Fark en çok ilk adımda belirgindi; o aşamada acil servis personelinin en az bilgiye sahip olduğu ve doğru kararı verme konusunda en acil durumda olduğu an.
Triyajda en büyük avantaj
Harvard Tıp Fakültesi, araştırmacıların modelleri test etmeden önce verileri ön işlemden geçirmediğini söyledi. Bunun yerine yapay zeka sistemleri, her teşhisin yapıldığı sırada elektronik hasta kaydında bulunan aynı bilgileri aldı.
Bu bilgileri kullanarak o1, triyaj vakalarının %67’sinde tam ya da çok yakın bir teşhis üretti. Bir hekim bu seviyeye %55’lik bir oranda ulaşırken, diğeri vakaların %50’sinde böyle yaptı.
“Modeli neredeyse her kıstasa karşı test ettik ve o, hem önceki modelleri hem de bizim hekim bazlarımızı geride bıraktı,” dedi Arjun Manrai; kendisi Harvard Tıp Fakültesi’nde bir yapay zeka laboratuvarına liderlik ediyor ve çalışmanın baş yazarlarından biri olarak okulun basın bülteninde yer aldı.
Bulgular, büyük dil modellerinin belirli ortamlarda güçlü tanı araçları olabileceğine dair artan kanıtlara katkı sağlıyor; yine de çalışma, onların gerçek dünyadaki acil durumlarda doktorların yerini almaya hazır olduğunu söylemekte çekimser davranıyor.
Kaynaklar:
Doppler VPN: 6 sunucu konumu, VLESS protokolü, sıfır takip. Ücretsiz başlayın.