Kajian Harvard mendapati AI mengatasi dua doktor dalam diagnosis di bilik kecemasan

AI vs. doktor bilik kecemasan
Satu kajian baharu yang diketuai Harvard mencadangkan model bahasa besar mungkin lebih baik daripada doktor manusia dalam mendiagnosis sesetengah pesakit bilik kecemasan, sekurang-kurangnya dalam ujian terkawal yang menggunakan kes klinikal sebenar.
Diterbitkan minggu ini dalam Sains, penyelidikan itu mengkaji bagaimana model OpenAI o1 dan 4o berprestasi dalam beberapa persekitaran perubatan, termasuk satu eksperimen berdasarkan 76 pesakit yang datang melalui bilik kecemasan Beth Israel. Sistem AI itu dibandingkan dengan diagnosis dari dua doktor perubatan bertugas dalaman, dan hasilnya disemak oleh dua doktor bertugas lain yang tidak mengetahui sama ada diagnosis datang daripada seorang doktor atau model.
Menurut kajian itu, o1 “sama ada menunjukkan prestasi sedikit lebih baik atau setanding dengan kedua-dua doktor bertugas dan 4o” pada setiap peringkat diagnostik. Perbezaan paling ketara ialah pada langkah pertama, apabila kakitangan kecemasan mempunyai maklumat paling sedikit dan tekanan paling tinggi untuk membuat keputusan yang betul.
Kelebihan paling ketara semasa triase
Harvard Medical School berkata para penyelidik tidak memproses terlebih dahulu data sebelum menguji model-model itu. Sebaliknya, sistem AI menerima maklumat yang sama yang tersedia dalam rekod perubatan elektronik pada masa setiap diagnosis dibuat.
Dengan menggunakan maklumat itu, o1 menghasilkan diagnosis tepat atau sangat hampir tepat dalam 67% kes triase. Seorang doktor mencapai tahap itu 55% masa, manakala doktor yang lain melakukannya dalam 50% kes.
“Kami menguji model AI itu terhadap hampir setiap penanda aras, dan ia melangkaui kedua-dua model sebelumnya serta asas rujukan doktor kami,” kata Arjun Manrai, yang mengetuai makmal AI di Harvard Medical School dan merupakan salah seorang penulis utama kajian itu, dalam kenyataan akhbar sekolah itu.
Penemuan ini menambah bukti yang semakin berkembang bahawa model bahasa besar boleh menjadi alat diagnostik yang kuat dalam keadaan tertentu, walaupun kajian itu berhenti sebelum menyatakan bahawa ia sudah bersedia untuk menggantikan doktor dalam kecemasan dunia sebenar.
Sumber:
Doppler VPN: 6 lokasi pelayan, protokol VLESS, tanpa penjejakan. Mulakan percuma.