A inteligência synthetic que pode “raciocinar” agora é capaz de diagnosticar cenários médicos da vida actual tão bem ou melhor que os médicos, de acordo com o resultados de um estudo publicado quinta-feira em Ciência.
Os pesquisadores usaram casos clínicos até então desconhecidos para testar o modelo de raciocínio o1 da OpenAI em relação ao modelo mais antigo da empresa, GPT-4, bem como médicos e residentes médicos em treinamento.
Em uma série de experimentos, o modelo o1 muitas vezes melhorou significativamente a capacidade de diagnóstico do GPT-4 e também superou os médicos. Quando testado com os registros eletrônicos de saúde de casos aleatórios do departamento de emergência de um hospital de Boston, o modelo o1 foi diagnóstico preciso em mais de dois terços das vezes na triagem inicial. Dois médicos assistentes especialistas tiveram diagnósticos corretos em aproximadamente metade das vezes.
O que a IA pode dizer sobre seu exame de sangue
Robert Wachter, professor e presidente do Departamento de Medicina da Universidade da Califórnia, em São Francisco, descreveu as descobertas do estudo como “importantes” e sugeriu que agora é “indiscutível” que a IA moderna superará os modelos de linguagem grandes e os médicos mais antigos quando solicitados a identificar o diagnóstico correto e o próximo passo. Ele não estava envolvido no estudo.
No entanto, Wachter, autor de “Um salto gigante: como a IA está transformando a saúde e o que isso significa para o nosso futuro”, acrescentou que são necessárias mais pesquisas antes que a IA seja totalmente implementada na prática clínica.
Velocidade da luz mashável
“A questão é até que ponto isso duplicate a vida actual, e a resposta é moderadamente boa, mas não perfeita”, escreveu Wachter por e-mail.
Como reconhecem os autores do estudo, os experimentos limitaram-se apenas à entrada de texto e não incluíram as pistas visuais e auditivas nas quais os médicos muitas vezes confiam para o diagnóstico. Isso pode incluir o nível de sofrimento do paciente e imagens médicas.
“A GenAI provavelmente pode começar a integrar essas informações, mas, por enquanto, um teste de um cenário de caso clínico escrito, e muitas vezes artificialmente ‘limpo’, não é o mesmo que entrar em um pronto-socorro e lidar com o caos”, disse Wachter. “Basta observar O Pitt.”
Quando será lançada a terceira temporada de ‘The Pitt’?
Com base nas suas descobertas, os autores do estudo destacaram uma necessidade “urgente” de mais estudos e ensaios clínicos prospectivos para determinar como os sistemas de IA podem melhorar a prática clínica e os resultados dos pacientes.
“O rápido ritmo de melhoria nos LLMs tem implicações substanciais para a ciência e a prática da medicina clínica”, escreveram os autores, muitos dos quais trabalham no Beth Israel Deaconess Medical Heart de Boston, onde o estudo foi realizado.
Um artigo acompanhantetambém publicado em Ciência e escrito por dois especialistas do Flinders Well being and Medical Analysis Institute em Adelaide, Austrália, que não estiveram envolvidos no estudo, concordou com as suas implicações urgentes. Eles também argumentaram contra a substituição dos médicos pela IA, prevendo, em vez disso, um estilo de colaboração que fornecesse supervisão, julgamento contextual e responsabilidade.
“Sem eficácia, equidade e segurança robustas e demonstradas, muitos sistemas de IA permanecerão insuficientes para uso clínico”, escreveram os especialistas.











