Início Tecnologia Esqueça os óculos inteligentes: pesquisadores da UW colocam pequenas câmeras em fones...

Esqueça os óculos inteligentes: pesquisadores da UW colocam pequenas câmeras em fones de ouvido para IA com viva-voz

24
0

VueBuds, um protótipo desenvolvido por pesquisadores da Universidade de Washington que incorporaram uma câmera do tamanho de um grão de arroz em cada fone de ouvido de um par padrão de fones de ouvido sem fio da Sony. (Foto UW)

Os fones de ouvido sem fio aparentemente surgiram do nada. Popularizados pelos AirPods da Apple, eles de repente estavam por toda parte – no metrô, no supermercado, nos ouvidos da pessoa sentada à sua frente – até que em algum lugar ao longo do caminho, eles se tornaram aquilo que quase todo mundo usa sem pensar duas vezes.

Essa popularidade poderia tornar os fones de ouvido melhores do que os óculos inteligentes para IA? Essa é a aposta por trás do VueBuds, um protótipo desenvolvido por pesquisadores da Universidade de Washington que incorporaram uma câmera do tamanho de um grão de arroz em cada fone de ouvido de um par padrão de fones de ouvido sem fio da Sony. O resultado é um assistente visible de IA escondido à vista de todos: olhe para uma lata de comida e pergunte quantas calorias ela contém, segure um utensílio de cozinha desconhecido e obtenha uma resposta em cerca de um segundo.

O sistema processa imagens no dispositivo e responde por meio de um modelo de IA conectado – sem necessidade de nuvem, sem imagens armazenadas.

A equipe da UW acredita que é a primeira a incorporar câmeras diretamente em fones de ouvido sem fio comerciais.

Os fones de ouvido não lembram de nada, mas as pessoas ao seu redor podem não saber disso. Essa tensão está no cerne do que a equipe da UW construiu e levanta uma questão que os pesquisadores levam a sério: quais são as normas sociais quando as câmeras são incorporadas em objetos que ninguém considera como câmeras?

A resposta da equipe é se esforçar bastante para minimizar a coleta de dados. As imagens são processadas e descartadas; nada é salvo. Mas o sistema não oferece nenhum sinal externo aos espectadores de que uma câmera está presente, o que os pesquisadores reconhecem ser um desafio aberto e não resolvido.

Para que tecnologias como essa ganhem confiança, Maruchi Kim, pesquisador principal e estudante de doutorado da UW na Escola Paul G. Allen de Ciência da Computação e Engenharia, argumentou que a privacidade não pode ser uma reflexão tardia.

“Não apoiamos o salvamento das imagens”, disse Kim. “Trata-se principalmente de estabelecer uma ponte entre a interação entre uma pessoa e o acesso à IA em movimento, especialmente em cenários de mãos livres.”

O outro argumento central da equipe é sobre o formato – e é um desafio claro para a Meta, que gastou anos e centenas de milhões de dólares tentando fazer dos óculos para câmeras um produto convencional.

A posição da equipe da UW é que os óculos inteligentes nunca se livrarão totalmente de sua bagagem social: a memória do Google Glass, o desconforto de ser observado, o sinal visível de que o usuário optou por algo que a maioria das pessoas não optou. Os fones de ouvido não carregam nada dessa história.

“Desde o início, não queríamos estar associados a isso”, disse Kim.

Colocar câmeras em fones de ouvido exigia primeiro resolver um problema de energia. As câmeras consomem muito mais energia do que os microfones, então a equipe optou por um sensor de baixo consumo de energia que captura aproximadamente um quadro por segundo em preto e branco – lento para os padrões de vídeo, mas rápido o suficiente para o estilo de interação de perguntas e respostas que os pesquisadores tinham em mente.

As câmeras são inclinadas de cinco a ten graus para fora, fornecendo um campo de visão de 98 a 108 graus, e as imagens de ambos os fones de ouvido são unidas em um único quadro antes do processamento, reduzindo o tempo de resposta para cerca de um segundo.

As aplicações variam do prático ao significativo. O sistema pode ler textos em embalagens de alimentos, identificar objetos e traduzir o coreano escrito. Mas para as pessoas com visão subnormal ou catarata, as implicações são mais profundas.

A equipe recebeu mais de uma dúzia de e-mails de pessoas com deficiência visible descrevendo para que o usariam: entender expressões faciais, ler livros, assistir televisão – tarefas que as ferramentas de IA existentes não podem suportar facilmente de maneira ambiente e sem usar as mãos.

Kim vê outro grupo carente na força de trabalho. Eletricistas, encanadores e trabalhadores em ambientes industriais muitas vezes não conseguem parar para pegar um telefone no meio da tarefa – um encaixe de tubo preso no lugar, um fio energizado que precisa de ambas as mãos.

Para esses trabalhadores, um assistente visible consultável por voz que não exige o toque na tela é a diferença entre ter acesso à IA e não tê-la.

“Há muito trabalho de colarinho azul em que essas pessoas não são realmente capazes de aproveitar os benefícios dos avanços recentes da IA”, disse Kim. “Eles não podem simplesmente pegar seus telefones e tirar uma foto.”

O enquadramento mãos-livres estende-se amplamente: cirurgiões, cozinheiros, qualquer pessoa que já tenha tentado seguir uma receita com as mãos molhadas.

O sistema permanece experimental e não está disponível para compra. Shyam Gollakota, professor da Allen College e pesquisador sênior do projeto, disse que o interesse das empresas de tecnologia tem sido significativo e que os fones de ouvido equipados com câmeras poderão chegar aos consumidores dentro de alguns anos.

Quanto aos custos, Gollakota está otimista. O sensor da câmera em si poderia custar menos de um dólar no nível dos componentes, disse ele – o que significa que na escala de um grande fabricante de eletrônicos de consumo, o preço premium em relação aos fones de ouvido padrão provavelmente seria modesto.

O valor de US$ 10 citado por Gollakota refere-se a uma estimativa mais conservadora em volumes de produção menores.

“O que fazemos nas universidades é mostrar que é possível resolver problemas técnicos”, disse Gollakota. “Aí mostramos um caminho para essas empresas e outras pessoas dizerem que isso é realmente possível.”

fonte

This hidden text is for search engines. Hidden Link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui