Studi Harvard menemukan AI mengungguli dua dokter dalam diagnosis ruang gawat darurat

AI vs. dokter UGD
Sebuah studi baru yang dipimpin Harvard menunjukkan bahwa large language models mungkin lebih baik daripada dokter manusia dalam mendiagnosis beberapa pasien ruang gawat darurat, setidaknya dalam pengujian terkontrol menggunakan kasus klinis nyata.
Diterbitkan minggu ini di Science, penelitian tersebut meneliti bagaimana model o1 dan 4o milik OpenAI tampil di berbagai pengaturan medis, termasuk satu eksperimen berbasis 76 pasien yang datang melalui UGD Beth Israel. Sistem AI dibandingkan dengan diagnosis dari dua dokter penanggung jawab spesialis penyakit dalam, dan hasilnya ditinjau oleh dua dokter penanggung jawab lain yang tidak mengetahui apakah sebuah diagnosis berasal dari dokter atau model.
Menurut studi tersebut, o1 “secara nominal tampil lebih baik atau setara dengan kedua dokter penanggung jawab dan 4o” di setiap tahap diagnostik. Perbedaan paling terlihat pada langkah pertama, ketika staf UGD memiliki informasi paling sedikit dan urgensi terbesar untuk membuat keputusan yang tepat.
Keunggulan terbesar pada triase
Harvard Medical School mengatakan para peneliti tidak melakukan pra-proses data sebelum menguji model. Sebagai gantinya, sistem AI menerima informasi yang sama yang tersedia di rekam medis elektronik pada saat setiap diagnosis dibuat.
Dengan informasi itu, o1 menghasilkan diagnosis yang tepat atau sangat mendekati dalam 67% kasus triase. Satu dokter mencapai angka tersebut 55% waktu, sedangkan dokter lainnya 50% kasus.
"Kami menguji model AI terhadap hampir semua tolok ukur, dan model ini melampaui baik model sebelumnya maupun tolok ukur dokter kami," kata Arjun Manrai, yang memimpin laboratorium AI di Harvard Medical School dan merupakan salah satu penulis utama studi tersebut, dalam siaran pers sekolah.
Temuan ini menambah bukti yang berkembang bahwa model bahasa besar dapat menjadi alat diagnostik yang kuat dalam pengaturan tertentu, meskipun studi tersebut tidak sampai menyatakan bahwa mereka siap menggantikan dokter dalam keadaan darurat dunia nyata.
Sumber:
Doppler VPN: 6 lokasi server, protokol VLESS, tanpa pelacakan. Mulai gratis.