A IA empresarial está entrando em uma nova fase – onde a questão central não é mais o que pode ser construído, mas como aproveitar ao máximo nosso investimento em IA.
Na última sessão do AI Impression Tour da VentureBeat, Brian Gracely, diretor de estratégia de portfólio da Purple Hat, descreveu a realidade operacional dentro de grandes organizações: expansão da IA, custos crescentes de inferência e visibilidade limitada sobre o que esses investimentos estão realmente retornando.
É o momento do “Dia 2” – quando os pilotos dão lugar à produção e os custos, a governação e a sustentabilidade tornam-se mais difíceis do que construir o sistema.
“Vimos clientes que dizem: ‘Tenho 50.000 licenças do Copilot. Não sei realmente o que as pessoas estão ganhando com isso. Mas sei que estou pagando pela computação mais cara do mundo, porque são GPUs'”, disse Gracely. “‘Como vou manter isso sob controle?'”
Por que os custos de IA empresarial são agora um problema no nível do conselho
Durante grande parte dos últimos dois anos, o custo não foi a principal preocupação das organizações que avaliavam a IA generativa. A fase experimental deu às equipas cobertura para gastar livremente e a promessa de ganhos de produtividade justificou o investimento agressivo, mas essa dinâmica está a mudar à medida que as empresas entram no seu segundo e terceiro ciclos orçamentais com IA. O foco mudou de “podemos construir alguma coisa?” para “estamos recebendo o que pagamos?”
As empresas que fizeram grandes apostas iniciais em serviços geridos de IA estão a realizar análises rigorosas para saber se esses investimentos estão a gerar valor mensurável. A questão não é apenas que a computação GPU é cara. Acontece que muitas organizações carecem de instrumentação para ligar os gastos aos resultados, tornando quase impossível justificar renovações ou escalar de forma responsável.
A mudança estratégica de consumidor de tokens para produtor de tokens
O modelo de aquisição de IA dominante dos últimos anos tem sido simples: pagar a um fornecedor por token, por assento ou por chamada de API e deixar que outra pessoa gerencie a infraestrutura. Esse modelo fazia sentido como ponto de partida, mas é cada vez mais questionado por organizações com experiência suficiente para comparar alternativas.
As empresas que passaram por um ciclo de IA estão começando a repensar esse modelo.
“Em vez de ser apenas um consumidor de tokens, como posso começar a ser um gerador de tokens?” Gracely disse. “Existem casos de uso e cargas de trabalho que fazem sentido para mim possuir mais? Isso pode significar operar GPUs. Pode significar alugar GPUs. E então perguntar: ‘Essa carga de trabalho precisa do melhor modelo de última geração? Existem modelos abertos mais capazes ou modelos menores que se encaixem?'”
A decisão não é binária. A resposta certa depende da carga de trabalho, da organização e da tolerância ao risco envolvida, mas a matemática está ficando mais complicada à medida que cresce o número de modelos abertos capazes, desde DeepSeek até modelos agora disponíveis através de mercados de nuvem. Agora, as empresas têm realmente alternativas reais aos poucos fornecedores que dominavam o cenário há dois anos.
A queda dos custos da IA e o aumento do uso criam um paradoxo para os orçamentos empresariais
Alguns líderes empresariais argumentam que apostar em investimentos em infra-estruturas agora pode significar pagamentos a mais no longo prazo, apontando para a declaração do CEO da Anthropic, Dario Amodei, de que os custos de inferência de IA estão a diminuir cerca de 60% ao ano.
O surgimento de modelos de código aberto, como o DeepSeek e outros, expandiu significativamente as opções estratégicas disponíveis para as empresas que estão dispostas a investir na infraestrutura subjacente nos últimos três anos.
Mas embora os custos por token estejam caindo, o uso está acelerando a um ritmo que mais do que compensa os ganhos de eficiência. É uma versão do Paradoxo de Jevons, o princípio económico de que as melhorias na eficiência dos recursos tendem a aumentar o consumo whole em vez de o reduzir, uma vez que custos mais baixos permitem uma adopção mais ampla.
Para os planejadores orçamentários empresariais, isso significa que a diminuição dos custos unitários não se traduz em diminuição do whole de contas. Uma organização que triplica o uso de IA enquanto os custos caem pela metade ainda acaba gastando mais do que antes. A consideração é quais cargas de trabalho realmente exigem os modelos mais capazes e mais caros e quais podem ser tratadas perfeitamente por alternativas menores e mais baratas.
O argumento comercial para investir na flexibilidade da infraestrutura de IA
A receita não é desacelerar o investimento em IA, mas construir tendo a flexibilidade como prioridade. As organizações que vencerão não serão necessariamente as que avançam mais rapidamente ou que gastam mais; são eles que constroem infra-estruturas e modelos operacionais capazes de absorver o próximo desenvolvimento inesperado.
“Quanto mais você construir algumas abstrações e ter alguma flexibilidade, mais poderá experimentar sem aumentar os custos, mas também sem comprometer seu negócio. Isso é tão importante quanto perguntar se você está fazendo todas as práticas recomendadas agora”, explicou Gracely.
Mas apesar de as discussões sobre IA se terem twister arraigadas nos ciclos de planeamento empresarial, a experiência prática que a maioria das organizações tem ainda é medida em anos, não em décadas.
“Parece que fazemos isso desde sempre. Fazemos isso há três anos”, acrescentou Gracely. “É cedo e está se movendo muito rápido. Você não sabe o que está por vir. Mas as características do que está por vir – você deve ter alguma noção de como será.”
Para os líderes empresariais que ainda estão a calibrar as suas estratégias de investimento em IA, esta pode ser a conclusão mais viável: o objetivo não é otimizar a estrutura de custos atual, mas construir a flexibilidade organizacional e técnica para se adaptar quando, e não se, ela mudar novamente.












