AI与科技news
哈佛研究发现人工智能在急诊室诊断中胜过两名医生
作者 Doppler Team••1分钟阅读

AI vs. ER doctors
一项由哈佛牵头的新研究表明,在使用真实临床病例的受控测试中,大型语言模型在诊断某些急诊病人方面可能优于人类医生。
本周发表在 Science 的这项研究考察了 OpenAI 的 o1 和 4o 模型在若干医疗环境下的表现,其中一项实验基于来自 Beth Israel 急诊室的 76 名患者。研究将这些 AI 系统的诊断与两名内科主治医师的诊断进行了比较,随后由另外两名并不知道诊断来源(医生或模型)的主治医师进行复核。
根据研究,o1 在每个诊断阶段“要么在名义上优于,要么与两名主治医师和 4o 持平”。差异在第一步最为明显——此时急诊人员掌握的信息最少且做出正确判断的紧迫性最大。
Strongest edge at triage
哈佛医学院表示,研究人员在测试模型之前并未对数据进行预处理。相反,AI 系统接收到的是在每次诊断作出时电子病历中可用的相同信息。
利用这些信息,o1 在分诊案例中给出了完全或非常接近的诊断的比例为 67%。一位医生的此类命中率为 55%,另一位为 50%。
“我们几乎用每一个基准测试了该 AI 模型,它都超越了先前的模型和我们的医师基线,”哈佛医学院 AI 实验室负责人、该研究的主要作者之一 Arjun Manrai 在学院的新闻稿中表示。
这些发现补充了越来越多的证据,表明大型语言模型在某些场景下可以成为强有力的诊断工具,尽管该研究并未断言它们已准备好在现实世界的急诊环境中取代医生。
来源:
Doppler VPN:6 个服务器位置,VLESS 协议,零追踪。免费开始.