Nota de leitura. Os números aqui citados provêm de análises publicadas pela SemiAnalysis e divulgadas pela Business Insider em junho de 2026. São medidas de laboratório, em condições favoráveis, produzidas por um ator próximo do ecossistema NVIDIA. Tomamo-las como uma tendência sólida, não como uma verdade universal. Hedging assumido do início ao fim.
Numa frase
O custo para produzir um milhão de tokens cairia, segundo a SemiAnalysis, da ordem dos 4,20 $ na geração anterior de chips para cerca de 0,12 $ nas novas placas NVIDIA Blackwell — ou seja, perto de 35 vezes mais barato. Se a tendência se confirmar, o acesso à IA deixa de ser uma vantagem: torna-se uma mercadoria. E quando a matéria-prima se torna quase gratuita, o valor desloca-se para o que permanece raro — o dado de negócio, o uso e a visão.
1. O que dizem os números
A NVIDIA implementa em grande escala, a partir do segundo semestre de 2026, a sua geração de chips Blackwell (sistemas GB300 NVL72). A SemiAnalysis comparou a sua eficiência com a da geração anterior, Hopper (H200). As diferenças relatadas são de uma ordem de grandeza invulgar.
Três números sobressaem do reporting:
- Custo por milhão de tokens: da ordem dos 4,20 $ para 0,12 $, ou seja, uma redução de cerca de 97 %.
- Tokens por megawatt: a potência elétrica igual, a Blackwell produziria até 50 vezes mais tokens do que a Hopper.
- Implementação: a subida de carga é esperada no segundo semestre de 2026, o que — se a tendência se confirmar — aumentaria regularmente a oferta de tokens a baixo custo.
O contexto confirma-o, aliás. Sam Altman reconheceu publicamente que « o custo da IA se tornou um verdadeiro problema ». Quando os próprios fornecedores falam do custo como um tema, é porque a pressão é real.
2. Duas armadilhas de leitura
Antes de tirar conclusões, duas nuances que a cobertura mediática escamoteia frequentemente.
Custo de produção ≠ preço de mercado. Que produzir um token custe 35 vezes menos não significa que o preço faturado caia outro tanto. Uma parte da economia é captada pelas margens, pela amortização dos chips (que custam caro na compra) e pela energia. A descida chegará — já começou em certos segmentos — mas provavelmente de forma desigual.
O paradoxo de Jevons. Quando um recurso se torna mais barato, não se consome menos: consome-se muito mais. Tokens baratos são modelos que se chamam dez vezes, agentes que raciocinam em malha, tarefas longas que nunca teríamos lançado ao preço cheio. A fatura total de uma empresa pode muito bem aumentar ao mesmo tempo que o preço unitário se desmorona. O desmoronamento do custo unitário não é o fim da despesa — é o início de outro uso.
« Um recurso que se torna abundante deixa de ser uma vantagem concorrencial. Mas não deixa de ter valor — é o uso que dele se faz que o tem. »
3. O valor desloca-se — para onde?
É o cerne do assunto. Durante dois anos, a narrativa dominante foi: « quem tem acesso aos melhores modelos ganha ». Essa narrativa envelhece. Se o token se torna uma mercadoria, ter acesso à IA já não distingue ninguém — como ter acesso à eletricidade já não distingue uma fábrica.
O valor migra então para o que permanece raro e difícil de copiar:
- O dado de negócio — um modelo genérico é de toda a gente; os seus dados, os seus casos de uso, o seu histórico de terreno, não.
- A interface simples — a capacidade de tornar uma potência bruta utilizável por um humano que não tem nem o tempo nem a vontade de aprender a fazer prompts.
- A integração no terreno — ligar a IA às ferramentas reais, aos processos reais, aos constrangimentos reais de uma organização.
- A velocidade de execução — transformar uma ideia em produto antes dos outros, quando toda a gente tem acesso à mesma matéria-prima.
- A compreensão do problema — saber qual problema vale a pena ser resolvido, o que nenhum modelo faz no seu lugar.
Já o escrevíamos a propósito do código, em A engenharia de software não morreu: quando a produção se torna abundante, não é o fim da profissão, é o fim do monopólio sobre o valor. O token segue exatamente a mesma curva que o código. E a conclusão é a mesma: os vencedores não serão aqueles que mais IA consomem, mas aqueles que melhor compreendem o problema a resolver.
4. O que isto muda, ator por ator
- Os vendedores de «magia» — aqueles que faturam o acesso à IA como uma proeza rara vão ser apanhados. Quando o custo de produção se desmorona, o discurso «é caro porque é IA» já não se aguenta.
- As editoras de infraestrutura — a batalha desloca-se para a eficiência por watt e por dólar. É exatamente a lógica da lei de Tau: a vantagem já não é a potência bruta, mas a eficiência.
- As pequenas estruturas, as associações, os independentes — grandes vencedores potenciais. Uma matéria-prima que se desmorona democratiza a produção. O que estava reservado aos gigantes torna-se acessível a uma equipa de três pessoas — desde que se tenha o dado e a visão.
- As organizações sem rumo — grandes perdedoras. Uma IA dez vezes mais barata aplicada a uma má ideia continua a ser uma má ideia, simplesmente servida mais depressa e em maior volume.
5. Sinais a vigiar
- A diferença produção / preço faturado. As API de grande consumo repercutirão a descida, e a que velocidade? A diferença entre custo de produção e tarifa dirá quem capta o valor.
- O consumo total. Se o paradoxo de Jevons jogar, veremos os volumes de tokens explodir mais depressa do que os preços descem. A vigiar nos comunicados dos grandes labs.
- Os novos usos tornados viáveis. Tarefas longas, agênticas, até aqui demasiado caras, vão tornar-se economicamente banais. É aí que nascerão os produtos interessantes.
- A independência dos números. Medidas vindas de atores não ligados à NVIDIA confirmarão a ordem de grandeza? Enquanto a fonte principal permanecer próxima do vendedor, impõe-se a prudência.
6. Uma palavra situada
A partir da Reunião, a 9000 km dos centros de cálculo que produzem estes tokens, esta notícia tem um sabor particular. Durante anos, a IA de ponta parecia reservada a quem podia pagar-lhe o preço. Se a matéria-prima se torna quase gratuita, a barreira financeira esbate-se — e resta apenas a barreira que verdadeiramente nos interessa: saber o que fazer com ela.
É uma boa notícia para um laboratório frugal. Nunca apostámos na quantidade de IA consumida, mas na pertinência do uso. Um território insular, uma pequena associação, um artesão: nenhum precisa do maior modelo do mundo. Precisam do bom problema, bem colocado, resolvido com a ferramenta mais simples que funciona.
A IA torna-se uma mercadoria. É precisamente por isso que a verdadeira raridade, amanhã, não será a potência. Será a visão.
Fontes e leituras complementares
- Business Insider — « AI token prices may crash as Nvidia Blackwell GPUs scale » (junho de 2026) — Artigo na origem desta nota; divulga a análise SemiAnalysis e as declarações de Sam Altman.
- SemiAnalysis — Análise comparativa GB300 NVL72 (Blackwell) contra H200 (Hopper); fonte dos números de custo e de eficiência (ator próximo do ecossistema NVIDIA — a ler como tal).
- NVIDIA — Dados InferenceX / InferenceMAX sobre Blackwell Ultra — Até 50× de débito por megawatt e 35× de descida do custo por token reivindicados (números do vendedor).
- Ryuzaki Labs — A engenharia de software não morreu e A lei de Tau — Duas análises sobre a comoditização e a eficiência, cujo raciocínio esta prolonga.
Este documento é atualizado se surgirem elementos novos. Última revisão: 文 13 de junho de 2026.