Início Tecnologia Os bate-papos por voz com IA ainda parecem estranhos porque os assistentes...

Os bate-papos por voz com IA ainda parecem estranhos porque os assistentes não sabem quando falar

8
0

Laboratório de Máquinas Pensantes diz está construindo IA full duplex, o que significa que um sistema de IA pode captar o que alguém está dizendo enquanto gera uma resposta. Em inglês simples, está mais próximo de um telefonema do que de um walkie-talkie.

A startup, fundada no ano passado pela ex-CTO da OpenAI Mira Murati, anunciou modelos de interação, começando com TML-Interplay-Small. Ele diz que o sistema pode responder em 0,40 segundos, um ritmo que o aproxima do vaivém humano comum.

Há um problema para quem deseja experimentá-lo hoje. Esta continua a ser uma prévia da pesquisa, com acesso limitado planejado para os próximos meses e um lançamento mais amplo esperado ainda este ano.

Um tipo mais rápido de troca de IA

A ideia central é fácil de entender e a mudança é significativa. Em vez de esperar que alguém termine de falar antes de trabalhar numa resposta, o modelo processa a fala recebida enquanto prepara sua resposta.

Esse atraso é importante porque as pausas fazem com que os assistentes de IA pareçam artificiais. O Considering Machines Lab enquadra o tempo de resposta de 0,40 segundo do TML-Interplay-Small o mais próximo da velocidade pure de conversação, o que seria uma mudança notável para ferramentas de voz.

Ele também afirma que o ritmo é mais rápido do que modelos comparáveis ​​da OpenAI e do Google. O benchmark dá peso ao anúncio, mas os usuários externos ainda precisam testar se a experiência funciona tão bem quanto o número sugere.

Quando a velocidade se torna comportamento

Um assistente que atende enquanto ainda recebe informações muda o que os usuários esperam de um chat de voz. A conversa pode ser mais rápida, mas o sistema também precisa administrar o tempo com muito mais cuidado.

Essa compensação é importante quando alguém deseja um esclarecimento rápido em vez de uma resposta longa. Respostas mais rápidas não ajudarão muito se o assistente intervir muito cedo, interpretar mal o orador ou interromper o fluxo que deveria melhorar.

Por enquanto, a arquitetura é a novidade. O verdadeiro teste do produto é se o modelo de interação pode fazer com que o melhor timing pareça automático.

O que assistir antes do lançamento

O cronograma de lançamento é o detalhe principal agora. O Considering Machines Lab afirma que uma prévia limitada da pesquisa chegará nos próximos meses, seguida por um acesso mais amplo ainda este ano.

Disponibilidade, preços, plataformas suportadas e desempenho fora dos testes controlados ainda não estão claros. Essas peças que faltam são importantes porque um modelo mais rápido só ajuda se as pessoas puderem usá-lo em ferramentas de voz do dia a dia.

Para quem usa assistentes de voz de IA, a atitude prática é observar a prévia com atenção. A IA full duplex é promissora, mas testes práticos devem mostrar se respostas mais rápidas realmente facilitam as conversas diárias sobre IA.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui