Исследование Гарварда: ИИ превзошёл двух врачей в постановке диагнозов в приёмном отделении

ИИ против врачей при приёме
Новое исследование под руководством Гарварда предполагает, что большие языковые модели могут превосходить врачей в диагностике некоторых пациентов, по крайней мере в контролируемых тестах на реальных клинических случаях.
Опубликованное на этой неделе в Сайенс, исследование изучало, как модели o1 и 4o от ОпенЭйАй показали себя в нескольких медицинских ситуациях, включая эксперимент, основанный на 76 пациентах, поступивших в приёмное отделение Бет-Израиль. Системы ИИ сравнивали с диагнозами двух лечащих врачей внутренних болезней, а результаты оценивали двое других лечащих врачей, которые не знали, получил ли диагноз врач или модель.
Согласно исследованию, o1 «в каждом диагностическом этапе либо номинально превосходила, либо была сопоставима с двумя лечащими врачами и 4o». Разница была наиболее заметна на первом этапе, когда у персонала приёма было меньше всего информации и наибольшая срочность принять правильное решение.
Наибольшее преимущество на триаже
Гарвардская медицинская школа заявила, что исследователи не проводили предварительную обработку данных перед тестированием моделей. Вместо этого системы ИИ получили ту же информацию, которая была доступна в электронной медицинской карте в момент постановки каждого диагноза.
Используя эту информацию, o1 дала точный или очень близкий диагноз в 67% случаев при триаже. Один из врачей достиг такого же показателя в 55% случаев, а другой — в 50% случаев.
«Мы тестировали модель ИИ практически по всем эталонам, и она затмила как предыдущие модели, так и наши врачебные базы», — сказал Арджун Манрай, руководитель лаборатории ИИ в Гарвардской медицинской школе и один из ведущих авторов исследования, в пресс-релизе школы.
Результаты добавляют доказательств тому, что большие языковые модели могут быть мощными инструментами диагностики в определённых условиях, хотя исследование не утверждает, что они готовы заменить врачей в реальных экстренных ситуациях.
Источники:
Doppler VPN: 6 локаций серверов, протокол ВЛЕСС, нулевая отслеживаемость. Начать бесплатно.