ハーバードの研究、救急外来の診断で人工知能が2人の医師を上回る

人工知能対救急外来の医師
ハーバード主導の新しい研究は、大規模言語モデルが、少なくとも実際の臨床ケースを用いた制御下のテストにおいて、ある種の救急外来患者の診断で人間の医師より優れている可能性を示唆しています。
今週Science誌に掲載されたこの研究では、オープンエーアイのo1および4oモデルがいくつかの医療環境でどのように機能するかを調べ、ベス・イスラエルの救急外来に来た76人の患者に基づく実験も含まれていました。AIシステムは内科の担当医2名の診断と比較され、診断が医師由来かモデル由来かを知らない別の担当医2名が結果をレビューしました。
研究によれば、o1は「各診断段階で2名の担当医および4oよりも名目上優れているか同等であった」と報告されています。差が最も顕著だったのは、救急スタッフが最も少ない情報しか持たず、正しい判断を急ぐ必要がある最初の段階、つまりトリアージ時でした。
トリアージで最も強い優位性
ハーバード・メディカル・スクールは、研究者たちがモデルをテストする前にデータを前処理しなかったと述べています。代わりに、AIシステムは各診断が行われた時点で電子カルテに存在していたのと同じ情報を受け取りました。
その情報を用いて、o1はトリアージ症例の67%で正確または非常に近い診断を出しました。1人の医師は55%で同水準に達し、もう1人は50%でした。
「我々はAIモデルを事実上あらゆるベンチマークに対してテストし、従来のモデルや我々の医師基準値をいずれも凌駕しました」と、ハーバード・メディカル・スクールのAIラボを率いる本研究の主要執筆者の一人、アルジュン・マンライは同校のプレスリリースで述べています。
この結果は、大規模言語モデルが特定の環境で強力な診断ツールになり得るという証拠を積み重ねるものでありながら、現実の緊急事態で医師に取って代わる準備が整っているとはまだ結論づけていません。
出典:
Doppler VPN: サーバー拠点6か所、VLESSプロトコル、トラッキングなし。 無料で始める.