Hoje, a IA de saúde baseada em Copenhague Corti está lançando o Symphony for Speech-to-Textual content, uma nova geração de modelos de reconhecimento de fala de nível clínico projetados especificamente para ditado em tempo actual, transcrição de conversação e processamento de áudio em lote – e sua taxa de precisão é a mais alta para este caso de uso específico já registrada.
“Estamos focados em garantir que nossos escribas de IA sejam confiáveis para médicos, profissionais da área médica e pacientes… todo o sistema de saúde”, disse Andreas Cleve, cofundador e CEO da Corti, em uma entrevista exclusiva por videochamada com VentureBeat.
Os dados de desempenho que a empresa está trazendo para a mesa pintam um quadro nítido do estado atual da IA empresarial: quando se trata de setores altamente regulamentados e especializados, os modelos específicos de domínio podem superar os fornecedores de modelos básicos.
Em um artigo de pesquisa recém-publicadoCorti revelou que seus novos modelos de fala de nível clínico reduziram as taxas de erro de palavras (WER) em até 93% quando comparados com os principais modelos de fala generalistas e APIs sobre terminologia médica.
Na terminologia médica inglesa, seu O Symphony for Speech-to-Textual content alcançou um WER notavelmente baixo de 1,4%. Em comparação, O modelo de fala da OpenAI registrou um WER de 17,7%, ElevenLabs atingiu 18,1%, Sussurro registrou 17,4%e Periquito obteve 18,9%.
O anúncio de Corti serve como um ponto de inflexão crítico para os construtores de cuidados de saúde. Embora APIs de uso geral, como o sussurro da OpenAI, sejam suficientes para transcrição de domínio amplo, elas frequentemente tropeçam em siglas médicas, dosagens complexas de medicamentos, taquigrafias e ambientes barulhentos de pronto-socorro. O Symphony for Speech-to-Textual content visa resolver isso, fornecendo aos desenvolvedores uma API de nível de produção altamente especializada, projetada desde o início para fluxos de trabalho clínicos.
A period da agência exige entradas de dados perfeitas
O lançamento do Symphony for Speech-to-Textual content destaca uma mudança basic na forma como os cuidados de saúde utilizam a tecnologia de voz. Durante décadas, o reconhecimento de fala médica consistiu principalmente na geração de um documento de texto estático para os médicos humanos revisarem – um substituto digital para um bloco de notas.
Mas à medida que a indústria da saúde avança para o que os tecnólogos chamam de “period agêntica”, onde agentes autônomos de IA auxiliam ativamente na tomada de decisões clínicas, na navegação de EHR e no suporte em tempo actual, a transcrição não é mais o produto closing. É a camada de dados basic.
“A fala sempre foi um dos insumos mais importantes da saúde”, disse Cleve em comunicado enviado à VentureBeat. “O que está mudando é o que acontece depois que as palavras são capturadas. Na period da agência, o reconhecimento de fala exige mais do que simplesmente produzir uma transcrição: precisamos fornecer aos sistemas de IA fatos clínicos precisos para raciocinar. Se um modelo ouvir mal um medicamento, dosagem ou sintoma, cada etapa posterior se tornará menos confiável. O Symphony for Speech-to-Textual content oferece aos construtores de serviços de saúde uma camada de fala precisa o suficiente para prosperar na realidade clínica.”
É aqui que entra em jogo o perigo crescente de altas taxas de erro de palavras. Se um modelo de IA de uso geral alucinar uma transcrição – transformando “hipertireoidismo” em “hipotireoidismo” ou interpretando mal uma dosagem crítica de medicamento – todos os agentes de IA subsequentes que confiarem nessa transcrição operarão com dados corrompidos. A arquitetura da Corti mitiga esse risco produzindo resultados estruturados e clinicamente utilizáveis diretamente da API, ajudando os aplicativos de IA downstream a raciocinar sobre fatos claros, em vez de texto confuso e não formatado.
Em nenhum lugar isso é mais evidente do que nos benchmarks de recall de entidades de Corti. O Symphony for Speech-to-Textual content alcançou um desempenho surpreendente Taxa de recuperação de 98,3% em entidades clínicas formatadas—como dosagens, medidas e datas. Em contraste, Corti relatou que o modelo de linha de base de uso geral mais forte atingiu o máximo de apenas 44,3% de recall fou as mesmas entidades.
Para os desenvolvedores que criam ferramentas de documentação de IA ambiental, essa lacuna de 54% é a diferença entre uma ferramenta que economiza tempo do médico e uma ferramenta que constitui uma responsabilidade médica.
Destronando os líderes da indústria
Embora os benchmarks de Corti em relação aos construtores LLM modernos, como OpenAI e ElevenLabs, sejam impressionantes, a empresa também visa gigantes legados da transcrição médica.
Durante anos, o padrão ouro para ditado clínico dedicado foi o Dragon Medical One. No entanto, esses sistemas legados foram historicamente otimizados estritamente para ditados clínicos intencionais, e não como infraestrutura subjacente para IA ambiental, conversas complexas entre várias partes ou ferramentas de suporte clínico em tempo actual.
Nas avaliações do ditado médico inglês do mundo actual, Corti alcançou um WER de 4,6%, superando os 5,7% do Dragon (uma melhoria relativa de 19%).
Além disso, Corti demonstrou maior recordação de termos médicos do que Dragon (93,5% versus 92,9%).
Ao fornecer esse nível de precisão por meio de um endpoint de API, a Corti está permitindo que desenvolvedores terceirizados, fornecedores de EHR e plataformas de atendimento digital criem suas próprias ferramentas personalizadas de ditado e escuta ambiente que superam o legado do setor.
“Queremos que as pessoas criem aplicativos com base em nossos modelos”, disse Cleve. “O objetivo é difundir a tecnologia tão amplamente quanto for necessária para que ela possa ser tão útil quanto possível para os pacientes e seus médicos e profissionais”.
Para Cleve e seus cofundadores, a missão é pessoal: a própria mãe de Cleve period uma profissional de saúde atacada por um paciente e passou anos lutando para se recuperar. Ele procurou melhorar os processos de saúde como forma de honrar seu sacrifício.
Resolvendo o quebra-cabeça do modelo de saúde
As demandas de cuidados de saúde vão muito além dos hospitais de língua inglesa, e os sistemas de saúde globais têm sido historicamente mal atendidos por modelos clínicos de PNL. Os primeiros adotantes já estão aproveitando os novos modelos da Corti em ambientes linguisticamente exigentes, provando a viabilidade da tecnologia em mercados internacionais complexos.
A Suíça, por exemplo, exige a prestação de cuidados em vários idiomas – muitas vezes simultaneamente numa única instituição médica. Serve como um dos campos de prova mais rigorosos para modelos de discurso médico multilíngue no mundo. Os modelos Symphony da Corti demonstraram enormes ganhos de desempenho nesses testes em idiomas diferentes do inglês, alcançando um WER de 2,4% em alemão (em comparação com 13,0% para o segundo melhor sistema) e um WER de 3,9% em francês (contra 10,6%).
“Numa conversa clínica, cada palavra importa – o nome de um medicamento esquecido, uma dosagem mal ouvida ou um sintoma mal transcrito podem mudar o significado de um encontro”, disse Pierre Corboz, Chefe de Soluções e Desenvolvimento de Negócios da Voicepoint, um fornecedor suíço de tecnologia de saúde, num comunicado fornecido à VentureBeat. “A precisão do Symphony na terminologia clínica nos dá a base para trazer recursos de IA mais confiáveis para fluxos de trabalho clínicos com nossa plataforma Voicepoint Xenon. Quando Corti melhora a camada de fala, os fluxos de trabalho que construímos juntos se tornam mais nítidos, mais seguros e mais úteis para os médicos na Suíça.”
A vrticalização e a especialização da IA estão gerando ganhos
O anúncio de hoje do Symphony for Speech-to-Textual content não é um evento isolado; é o culminar de uma narrativa estratégica que Corti tem promovido agressivamente nas últimas semanas.
A plataforma Symphony mais ampla – que alimenta aplicações clínicas e administrativas para uma rede international de fornecedores de EHR e organizações de ciências biológicas – tem provado sistematicamente a defensabilidade dos laboratórios verticais de IA contra gigantes tecnológicos horizontais.
Este é o terceiro grande benchmark que Corti lança em apenas seis semanas, abordando diferentes camadas do desempenho da IA em saúde.
Em abril, a empresa revelou que seu Sinfonia para codificação médica O sistema superou os modelos de uso geral em mais de 25% em benchmarks de precisão clínica, abordando um dos fluxos de trabalho mais notoriamente complexos da área de saúde.
E na semana passada, Corti anunciou que seu principal modelo de nível clínico superou OpenAI no HealthBench Professionalreferência de saúde da própria OpenAI.
Tomados em conjunto, estes três pontos de dados – codificação médica, raciocínio clínico e precisão da fala para texto – ilustram um consenso crescente no sector da tecnologia empresarial: os modelos generalizados estão a atingir um limite máximo nas indústrias regulamentadas.
Os modelos implantados em hospitais devem compreender inerentemente siglas complexas, interrupções repentinas, taquigrafia médica, linguagem específica da especialidade e restrições estritas de conformidade. Ao treinar especificamente nesses casos extremos exclusivos, laboratórios verticais de IA como o Corti estão construindo um fosso formidável que as empresas que dependem apenas de chamadas de API para grandes modelos generalizados de linguagem não conseguem cruzar facilmente.
Disponibilidade e linha de produtos
Os desenvolvedores estão claramente percebendo a lacuna de desempenho. De acordo com dados de impulso fornecidos à VentureBeat, Corti está vendo um crescimento de 30% em novas inscrições para sua plataforma nas comparações trimestrais, sinalizando que os desenvolvedores e construtores de saúde estão gravitando ativamente em direção a modelos verticais de nível clínico em vez de APIs generalistas.
A Corti, que já atende mais de 100 milhões de pacientes anualmente nos principais sistemas de saúde, incluindo o Serviço Nacional de Saúde (NHS) do Reino Unido, está posicionando o Symphony for Speech-to-Textual content como o mecanismo padrão para a próxima geração de software program de saúde.
É importante observar que Corti não está lançando a plataforma Symphony abrangente hoje; em vez disso, o Symphony for Speech-to-Textual content opera como um recurso novo e distinto dentro desse ecossistema mais amplo, acessível por meio de seus próprios endpoints de API.
O Symphony for Speech-to-Textual content está disponível a partir de hoje. Os desenvolvedores e arquitetos corporativos podem acessar os modelos por meio do console Corti API, com documentação técnica completa disponível para ajudar a integrar a camada de fala de nível clínico em seus aplicativos existentes.
Num movimento em direcção à transparência da investigação, a Corti também publicou o seu artigo de investigação completo detalhando a sua metodologia, juntamente com uma ferramenta de comparação separada concebida para apoiar a avaliação transparente dos sistemas médicos de reconhecimento de fala em toda a indústria.
À medida que o setor de saúde continua a adotar rapidamente a automação orientada por IA, a camada de dados basic nunca foi tão crítica. O último lançamento de Corti é um lembrete claro de que, na área médica, a IA genérica simplesmente não é boa o suficiente. O futuro pertence aos especialistas.











