O custo da IA: empresas correm para controlar gastos com tokens
Sabe quando você começa a usar um serviço novo e ele parece uma maravilha, mas de repente a conta chega e você se assusta? Pois é, isso está acontecendo com a IA em várias empresas. Não é um ou outro caso isolado; é uma tendência que está pegando todo mundo de surpresa.
A Uber, por exemplo, estourou todo o orçamento de IA para 2026 já em abril. A Microsoft cancelou licenças de uma ferramenta de IA para desenvolvedores meses depois de liberá-las. E ouvi dizer que um funcionário da Priceline viu a renovação de um contrato de IA ficar 4 a 5 vezes mais cara. Parece que o barato da IA saiu bem caro.
Mesmo com o preço por token caindo, a verdade é que estamos usando cada vez mais IA. E com os assistentes autônomos ficando mais espertos, o consumo de tokens só aumenta. Aquelas empresas que se jogaram de cabeça em assinaturas ‘tudo incluído’ no começo de 2025 agora estão correndo para entender onde o dinheiro foi parar e como podem, pelo menos, ter algum retorno sobre o investimento.
É nesse cenário que um novo mercado está surgindo. Startups, empresas já estabelecidas e até um novo órgão de padronização estão se unindo para dar às empresas as ferramentas e a linguagem para controlar esses gastos.
“Seis meses atrás, eu conversava com um cliente e era tudo sobre ‘O que isso pode fazer? É bom o suficiente?’ Nossas conversas nunca são sobre isso agora. Agora as conversas são sobre, ‘ei, estamos gastando muito. Que visibilidade você tem? Que auditabilidade você tem? Que controles de token você tem? Qual é a eficiência dos seus modelos?’”, disse Alexander Embricos, da OpenAI, ao TechCrunch.
A Linux Foundation, por exemplo, anunciou a criação da Tokenomics Foundation. A ideia é trazer para os tokens de IA a mesma disciplina de custos que o FinOps trouxe para os gastos com a nuvem.
J.R. Storment, da FinOps Foundation, contou que em abril e maio, as empresas começaram a ligar desesperadas: “Meu Deus, já gastamos 3 vezes o orçamento de tokens de 2026 e ainda é abril!”. A conversa mudou de “vamos usar tudo e ir rápido” para “precisamos de limites, como controlamos isso?”.
Essa gritaria veio depois que os CEOs empurraram suas equipes para usar os melhores modelos, sem se preocupar com os custos. Modelos novos, como o Claude Opus 4.5 da Anthropic e o GPT-5.1 da OpenAI, melhoraram muito as ferramentas autônomas, e isso multiplicou o consumo. Teve uma empresa que, supostamente, recebeu uma conta de 500 milhões de dólares do Claude porque esqueceu de definir limites de uso para os funcionários. É de cair o queixo!
“É como a epidemia de crack-cocaína”, comparou Chris Reed, da Priceline, notando que a empresa começou a colocar limites de tokens em alguns grupos. “Eles deixam você experimentar para te viciar, e agora você está meio que refém disso.”
Vitaly Gordon, CEO da Faros AI, contou que um CTO disse a ele: “Um dos meus engenheiros gastou 40 mil dólares em tokens no mês passado, e eu sinceramente não sei se devo impedi-lo ou se devo dizer a todos os outros para serem como ele.”
Uma pesquisa da Faros mostrou que, embora a produtividade dos desenvolvedores tenha aumentado com a IA, os bugs e as refatorações também cresceram. Outra plataforma, a Jellyfish, descobriu que engenheiros que usavam mais tokens eram duas vezes mais produtivos, mas gastavam 10 vezes mais tokens para isso. Ou seja, a produtividade nem sempre compensa o gasto.
Nicholas Arcolano, da Jellyfish, explicou que o gasto com IA está explodindo por causa das funcionalidades autônomas, com o consumo por desenvolvedor aumentando cerca de 18,6 vezes em nove meses. No fim das contas, a relação entre produtividade e custo fica meio nebulosa.
O problema é que medir o valor real do código gerado pela IA (e o impacto na receita) ainda é um desafio para a maioria das empresas. E essa dificuldade de medição se agrava com a escala do uso da IA.
Controlar os custos da nuvem já era um desafio enorme, com milhões de linhas de dados por mês. Com os tokens, estamos falando de trilhões de linhas por mês! Não dá para colocar isso em uma planilha simples. É preciso repensar completamente as ferramentas e os sistemas de contabilidade.
Na Priceline, já estão vendo discrepâncias entre o uso reportado pelos fornecedores e os dados internos. “Comecei minha carreira em gestão de despesas de telecomunicações, e estou vendo todos os mesmos paralelos, de telecomunicações para a nuvem e agora para a IA”, disse Reed. “Sempre que você introduz algo novo, é terreno fértil para erros de faturamento, auditorias e oportunidades de otimização.”
O mercado está reagindo. Empresas como a Pay-i e a Paid estão focadas em rastrear e otimizar os custos de IA. Outras, como Jellyfish, Waydev e Faros AI, monitoram agentes de IA para provar o retorno sobre o investimento. E até empresas com soluções já existentes, como Ramp, Datadog e New Relic, estão adicionando recursos para gerenciar os gastos com IA. Parece que a era de gastar sem olhar a conta está chegando ao fim.


