FinOps para IA: Como o TCU Espera que Você Controle Custos de Inteligência Artificial
FinOps para IA é a disciplina de governança financeira que garante rastreabilidade, controle e otimização dos custos de inteligência artificial. Entenda como funciona, o que o TCU exige e como implementar.
FinOps para IA: Como o TCU Espera que Você Controle Custos de Inteligência Artificial
Inteligência artificial é cobrada por uso. Cada pergunta feita a um modelo de linguagem, cada documento analisado, cada imagem gerada consome recursos medidos em tokens — e cada token tem um preço. Quando uma organização pública adota IA sem controle financeiro, os custos podem escalar de forma imprevisível e impossível de rastrear. O Acórdão TCU 292/2025-Plenário deixou claro que isso não é aceitável: o Tribunal espera práticas de FinOps — governança financeira de recursos em nuvem — aplicadas a todo serviço consumido sob demanda, incluindo inteligência artificial.
Este artigo explica como funciona a economia de IA, por que custos saem de controle, o que o TCU exige e como implementar FinOps de IA na prática.
Como funciona a cobrança de IA
O modelo de tokens
Provedores de inteligência artificial cobram por tokens processados. Um token é uma unidade de texto — aproximadamente 4 caracteres em inglês ou 2 a 3 caracteres em português. Uma frase como "O que é governança de IA?" contém cerca de 12 tokens.
Cada requisição a um modelo de IA envolve dois tipos de tokens: tokens de entrada (o prompt enviado) e tokens de saída (a resposta gerada). Os provedores cobram por ambos, geralmente com preços diferentes — tokens de saída costumam ser mais caros que tokens de entrada.
A variação de preços
Os preços variam enormemente entre provedores e modelos. Um modelo de última geração como o GPT-4o ou o Claude Opus custa significativamente mais por token do que um modelo menor como o GPT-4o-mini ou o Haiku. A diferença pode chegar a 10x ou mais.
Isso cria uma oportunidade e um risco. A oportunidade é usar o modelo certo para cada tarefa — modelos menores para tarefas simples, modelos maiores para tarefas complexas — otimizando o custo sem sacrificar qualidade. O risco é que, sem essa otimização, a organização pague preços premium para todas as tarefas, inclusive as mais triviais.
O efeito escala
Em pequena escala, custos de IA parecem irrelevantes. Uma conversa com o ChatGPT custa centavos. Mas quando centenas de servidores usam IA diariamente, processando documentos, gerando relatórios, analisando dados, o volume de tokens se multiplica exponencialmente. Uma organização com 500 usuários ativos, cada um fazendo 20 requisições por dia com prompts de 2.000 tokens e respostas de 1.000 tokens, consome 30 milhões de tokens por dia. Dependendo do modelo, isso pode representar dezenas de milhares de reais por mês.
Por que custos de IA saem de controle
Ausência de visibilidade
O problema mais comum é a falta de visibilidade consolidada. Quando departamentos contratam IA de forma independente — cada um com seu provedor, sua conta, sua fatura — ninguém sabe o custo total. O gestor financeiro só descobre quando recebe faturas dispersas no fim do mês, sem contexto sobre quem consumiu o quê.
Uso sem limites
Sem franquias ou alertas, não há mecanismo natural de contenção. Um departamento que descobre as possibilidades da IA pode, de boa fé, consumir recursos muito acima do previsto. Um único projeto de análise de documentos pode processar milhões de tokens em poucos dias se não houver limites configurados.
Escolha inadequada de modelos
Organizações que usam o modelo mais caro para todas as tarefas desperdiçam recursos. Se um servidor usa o GPT-4o para responder perguntas simples que o GPT-4o-mini resolveria com qualidade equivalente, está pagando 10 vezes mais do que precisaria. Multiplicado por centenas de usuários, o desperdício é substancial.
Shadow AI
Servidores usando IA em contas pessoais — o fenômeno do shadow AI — geram custos invisíveis e incontroláveis. Mesmo que o servidor pague do próprio bolso (o que é raro), a organização está exposta a riscos de dados e compliance. Quando a organização finalmente institucionaliza o uso, descobre que o volume real de consumo era muito maior do que imaginava.
O que o TCU exige: FinOps como disciplina
O Acórdão TCU 292/2025-Plenário incorporou explicitamente o conceito de FinOps nas exigências de governança para serviços em nuvem. Embora o acórdão trate especificamente de nuvem, a aplicação a IA é direta — já que IA é consumida como serviço em nuvem.
O TCU espera que a organização demonstre:
Rastreabilidade entre planejamento e execução: o que foi orçado corresponde ao que foi gasto? A organização consegue demonstrar que os recursos destinados a IA foram utilizados conforme o planejado? Granularidade de custos: o órgão consegue discriminar custos por departamento, por provedor, por tipo de serviço e por período? Ou apenas tem uma fatura consolidada sem detalhamento? Mecanismos de controle: existem franquias, alertas e limites que impedem o descontrole? Ou o órgão só descobre que estourou o orçamento quando a fatura chega? Otimização: o órgão está usando os recursos de forma eficiente? Ou está pagando preços premium para tarefas que poderiam ser executadas com modelos mais baratos?Essas não são perguntas retóricas. São os critérios que o TCU vai usar para avaliar se a contratação de IA está sendo gerida de forma responsável.
Os componentes de FinOps para IA
Franquias por departamento
Cada departamento recebe uma franquia mensal de consumo de IA, expressa em valor monetário (R$) ou em volume de tokens. Quando a franquia se aproxima do limite, alertas são disparados. Quando atinge o limite, o consumo pode ser bloqueado, redirecionado para modelos mais baratos ou autorizado manualmente por um gestor.
A franquia permite que cada departamento use IA com liberdade — dentro de um orçamento definido e aprovado. É o equilíbrio entre produtividade e controle que a governança de IA exige.
Alertas automáticos de consumo
Notificações configuráveis que disparam quando um departamento atinge determinados patamares de consumo — por exemplo, 50%, 75% e 90% da franquia. Os alertas permitem que gestores intervenham antes de ultrapassar o orçamento, em vez de descobrir o problema retrospectivamente.
Dashboards de custo em tempo real
Painéis que mostram, em tempo real, o consumo de IA por departamento, provedor, modelo e tipo de uso (chat, embedding, imagem, áudio). O gestor pode visualizar tendências, identificar anomalias e tomar decisões informadas sobre alocação de recursos.
Faturas detalhadas
Relatórios periódicos que discriminam o custo total por todas as dimensões relevantes: departamento, provedor, modelo, tipo de uso, período. Essas faturas são a base para a prestação de contas ao TCU e à CGU.
Roteamento otimizado por custo
O broker de IA pode ser configurado para direcionar automaticamente cada requisição ao provedor que oferece o menor custo para o modelo e tipo de tarefa solicitados. Isso garante que a organização sempre pague o menor preço possível sem intervenção manual.
Relatórios de otimização
Análises periódicas que identificam oportunidades de economia: departamentos que usam modelos premium para tarefas simples, provedores mais caros sendo utilizados quando alternativas mais baratas têm desempenho equivalente, picos de uso que poderiam ser redistribuídos.
Como implementar FinOps de IA na prática
Passo 1: levantar a situação atual
Antes de implementar controles, é preciso entender o cenário. Quantos departamentos usam IA? Quais provedores? Qual o gasto mensal estimado — incluindo shadow AI? Essa fotografia inicial define a linha de base para medir progresso.
Passo 2: centralizar em uma plataforma de governança
FinOps de IA é inviável quando cada departamento opera de forma independente. A centralização em uma plataforma como o Adapt11 é o que torna possível ter visibilidade consolidada, franquias por departamento e billing unificado.
Passo 3: definir franquias e políticas
Com a plataforma implementada, defina franquias mensais por departamento, modelos permitidos por tipo de uso, limites de gasto e regras de escalonamento (o que acontece quando a franquia acaba).
Passo 4: configurar alertas e dashboards
Ative alertas automáticos nos patamares definidos e configure dashboards para que gestores tenham visibilidade contínua do consumo.
Passo 5: otimizar continuamente
FinOps é processo contínuo. Revise mensalmente os relatórios de uso, identifique oportunidades de otimização, ajuste franquias conforme a demanda real e atualize as políticas de roteamento conforme novos modelos e provedores surgem.
Passo 6: documentar para auditoria
Mantenha a documentação que o TCU pode solicitar: políticas de franquia, relatórios de consumo, evidências de controle, registros de auditoria. Com uma plataforma que gera trilha de auditoria com integridade criptográfica, essa documentação é produzida automaticamente.
Perguntas frequentes sobre FinOps para IA
O que é FinOps para IA?FinOps para IA é a aplicação da disciplina de governança financeira de nuvem ao consumo de inteligência artificial. Inclui rastreabilidade de custos, franquias de consumo, alertas automáticos, dashboards de billing e otimização de gastos.
Como funciona a cobrança de IA por tokens?Provedores cobram por tokens processados. Um token equivale a cerca de 4 caracteres em inglês ou 2-3 em português. Cada requisição consome tokens de entrada (prompt) e de saída (resposta), com preços distintos por provedor e modelo.
O TCU exige FinOps para IA?Sim. O Acórdão TCU 292/2025-Plenário estabeleceu a necessidade de práticas de FinOps para serviços em nuvem, com rastreabilidade entre planejamento e execução orçamentária — aplicável a serviços de IA.
Como controlar custos de IA por departamento?Utilize uma plataforma de governança com franquias mensais por departamento, alertas de consumo, limites automáticos e relatórios detalhados por área, provedor e modelo.
Como otimizar custos de IA sem perder qualidade?Use modelos menores para tarefas simples, modelos maiores para tarefas complexas, configure roteamento por custo, monitore o consumo e revise periodicamente a relação custo-resultado de cada modelo.
Conclusão: FinOps é o que torna a adoção de IA sustentável
Adotar IA no setor público sem controle financeiro é como entregar cartões corporativos sem limite a centenas de servidores e esperar que os gastos fiquem dentro do orçamento. Não vai funcionar.
FinOps para IA é o mecanismo que garante que a adoção seja sustentável, rastreável e auditável. É o que permite que a organização diga ao TCU, com precisão: "Gastamos R$ X com IA no último trimestre, distribuídos assim entre departamentos, provedores e modelos, dentro do orçamento aprovado."
O PBIA 2024-2028 está colocando bilhões de reais em inteligência artificial no setor público. FinOps é o que separa a organização que investe bem da que desperdiça recursos públicos. E o TCU já deixou claro de que lado quer ver cada órgão.
O Adapt11 é a plataforma brasileira de governança de inteligência artificial que funciona como broker de múltiplos provedores. Com trilha de auditoria inviolável, controle de custos por departamento, conformidade com LGPD e 4 modos de entrega para soberania de dados, o Adapt11 foi projetado para o setor público. Agendar demonstração → | Solicitar material para licitação → | Conheça a solução →
Tags
O Adapt foi projetado para governança de IA no setor público.
Trilha de auditoria inviolável, controle de custos, conformidade LGPD e 4 modos de entrega.