Estudo de Harvard aponta que IA superou dois médicos em diagnósticos no pronto-socorro

IA vs. médicos do pronto-socorro
Um novo estudo liderado por Harvard sugere que modelos de linguagem grande podem ser melhores do que médicos humanos ao diagnosticar alguns pacientes de pronto-socorro, pelo menos em testes controlados usando casos clínicos reais.
Publicado esta semana em Science, a pesquisa examinou como os modelos o1 e 4o da OpenAI se saíram em vários cenários médicos, incluindo um experimento com base em 76 pacientes que passaram pelo pronto-socorro do Beth Israel. Os sistemas de IA foram comparados com diagnósticos de dois médicos assistentes de medicina interna, e os resultados foram revisados por outros dois médicos assistentes que não sabiam se um diagnóstico vinha de um médico ou de um modelo.
Segundo o estudo, o o1 “ou performou nominalmente melhor que ou no mesmo nível dos dois médicos assistentes e do 4o” em cada etapa diagnóstica. A diferença foi mais notável na primeira etapa, quando a equipe do pronto-socorro tinha menos informação e maior urgência para tomar a decisão correta.
Maior vantagem na triagem
A Faculdade de Medicina de Harvard afirmou que os pesquisadores não pré-processaram os dados antes de testar os modelos. Em vez disso, os sistemas de IA receberam as mesmas informações disponíveis no prontuário eletrônico no momento em que cada diagnóstico foi feito.
Com essas informações, o o1 produziu o diagnóstico exato ou muito próximo em 67% dos casos de triagem. Um dos médicos alcançou essa marca 55% das vezes, enquanto o outro o fez em 50% dos casos.
“Testamos o modelo de IA contra virtualmente todos os referenciais, e ele eclipsou tanto modelos anteriores quanto nossas linhas de base médicas,” disse Arjun Manrai, que lidera um laboratório de IA na Faculdade de Medicina de Harvard e é um dos autores principais do estudo, no comunicado da escola.
As conclusões somam-se a evidências crescentes de que modelos de linguagem grande podem ser ferramentas diagnósticas fortes em certos contextos, embora o estudo não afirme que eles estejam prontos para substituir médicos em emergências do mundo real.
Fontes:
Doppler VPN: 6 localidades de servidor, protocolo VLESS, sem rastreamento. Comece grátis.