A Anthropic estaria explorando seu próprio chip de IA: conversas com a Samsung sobre 2 nm, talentos da OpenAI e a próxima guerra da computação
A Anthropic estaria explorando um chip de IA personalizado e discutiu possíveis opções de fabricação com a Samsung, incluindo tecnologia avançada de processo de 2 nm e empacotamento. O projeto parece estar em estágio inicial, mas se encaixa em uma mudança mais ampla na infraestrutura de IA: empresas de modelos querem cada vez mais controle sobre o hardware que alimenta seus sistemas. A iniciativa não significa necessariamente que a Anthropic esteja abandonando o AWS Trainium, os TPUs do Google ou as GPUs da NVIDIA. Em vez disso, aponta para uma estratégia de longo prazo: usar múltiplos caminhos de computação, reduzir riscos de fornecimento e melhorar a eficiência de custos em escala de fronteira. O chip Jalapeño da OpenAI mostra que o silício personalizado está se tornando parte do manual da IA de fronteira. A Anthropic pode agora estar dando os primeiros passos por um caminho semelhante. **O ponto principal: chips de IA personalizados já não são apenas uma história de empresas de hardware; estão se tornando uma estratégia central para os maiores laboratórios de IA.**

Segundo relatos, a Anthropic está explorando seu próprio chip de IA: conversas com a Samsung sobre 2 nm, talentos da OpenAI e a próxima guerra da computação
Introdução
A Anthropic há muito se apresenta como uma empresa que não quer depender de um único caminho de hardware. Sua estratégia de computação foi construída em torno de uma combinação de AWS Trainium, TPUs do Google e GPUs da NVIDIA. Essa abordagem multiplataforma dá à criadora do Claude mais flexibilidade do que uma estratégia puramente centrada na NVIDIA.
Mas reportagens recentes sugerem que a Anthropic pode agora estar considerando uma quarta carta: seu próprio chip de IA personalizado.
De acordo com o artigo original, o The Information informou que a Anthropic iniciou trabalhos preliminares em um chip de IA personalizado e discutiu possíveis opções de fabricação com a Samsung Electronics. As opções relatadas incluem o processo de 2 nm da Samsung e empacotamento avançado, ambos altamente relevantes para aceleradores de IA modernos.

Isso não significa que a Anthropic esteja pronta para substituir seus atuais fornecedores de computação. O projeto ainda é descrito como em estágio inicial. A finalidade do chip, o desempenho-alvo, a integração em servidores e o plano de implantação em clusters ainda não foram finalizados. Ainda assim, a direção é clara: à medida que a IA de fronteira se torna mais cara para treinar e operar, os maiores laboratórios de IA estão sendo puxados cada vez mais para dentro da pilha de hardware.
Segundo relatos, a Anthropic está conversando com a Samsung sobre um chip de IA personalizado
O ponto central da reportagem é simples, mas importante: segundo relatos, a Anthropic iniciou uma exploração preliminar de seu próprio chip de IA e manteve conversas com a Samsung sobre fabricação.

As opções em discussão supostamente incluem o processo de 2 nm da Samsung e empacotamento avançado. Em hardware de IA, esses dois pontos são muito importantes.
Um nó de processo menor pode colocar mais transistores em uma área de chip semelhante, aumentando a possibilidade de maior desempenho e melhor eficiência energética. O empacotamento avançado é igualmente importante. Chips modernos de IA frequentemente precisam mover enormes quantidades de dados entre unidades de computação e memória de alta largura de banda. Quanto mais curto e rápido esse caminho de dados se torna, menos tempo o chip desperdiça esperando pela memória.
Em julho de 2024, a Samsung anunciou uma solução semicondutora turnkey para a Preferred Networks que combinava seu processo GAA de 2 nm com empacotamento 2.5D. O artigo original aponta isso como o tipo de combinação de fabricação e empacotamento que a Anthropic pode estar avaliando.

Por enquanto, isso continua sendo uma discussão relatada, e não um roteiro de produto confirmado da Anthropic. A posição pública da Anthropic ainda é que AWS Trainium, TPUs do Google e GPUs da NVIDIA continuam sendo centrais para a forma como a empresa expande sua capacidade de computação.
É exatamente por isso que a história é interessante. A Anthropic não é uma empresa sem parceiros de computação. Ela já tem vários. Se ainda assim está explorando um chip personalizado, o motivo provavelmente não é uma substituição de curto prazo. É poder de negociação e flexibilidade de longo prazo.
Dois sinais: contratações e conversas com fundições
O artigo original destaca dois movimentos que tornam a reportagem mais significativa.
O primeiro é a contratação. Segundo relatos, a Anthropic trouxe Clive Chan, um dos primeiros integrantes da equipe de chips personalizados da OpenAI. Ele também havia trabalhado no projeto do supercomputador Dojo, da Tesla. Contratações de hardware como essa geralmente não acontecem por acaso. Elas são um sinal de que a empresa quer capacidade interna, não apenas acesso a fornecedores externos.

O segundo sinal é a própria conversa relatada com a Samsung. Reportagens anteriores já haviam sugerido que a Anthropic estava considerando chips personalizados como uma forma de lidar com a escassez de computação. Passar de “pensar em chips” para “conversar com um potencial parceiro de fabricação” sugere que a ideia avançou ao menos um passo em direção a uma avaliação prática.
Ainda assim, a distância entre um projeto inicial de chip e um acelerador de IA implantado é enorme. Antes que um chip possa fazer diferença em produção, uma empresa precisa definir a carga de trabalho, projetar a arquitetura, validar o silício e garantir o empacotamento.
capacidade, construir placas e servidores, integrar redes e provar que o sistema completo pode funcionar em escala de cluster.
Esse processo leva tempo. Também custa muito dinheiro.
A quarta carta imposta pela conta de computação
Para entender por que a Anthropic sequer consideraria esse caminho, comece pelo tamanho do problema de computação.
O artigo original aponta para o crescimento extremamente rápido da receita da Anthropic e para a pressão que esse crescimento exerce sobre a infraestrutura. Quanto mais clientes usam o Claude, mais capacidade de treinamento e inferência a empresa precisa. Uma adoção mais rápida do produto não cria apenas uma curva de receita. Ela cria uma conta de computação.
O anúncio oficial da Anthropic em abril de 2026 afirmou que a empresa havia ampliado sua parceria com o Google e a Broadcom para múltiplos gigawatts de capacidade de TPUs de próxima geração, com entrada em operação prevista a partir de 2027. O mesmo anúncio disse que a Anthropic executa o Claude em AWS Trainium, TPUs do Google e GPUs da NVIDIA, com a Amazon permanecendo como sua principal provedora de nuvem e parceira de treinamento.

A estratégia é fácil de entender: usar diferentes plataformas de hardware para diferentes cargas de trabalho, reduzir o risco de dependência de um único fornecedor e manter sistemas críticos resilientes.
Mas, em escala de fronteira, até pequenas melhorias de eficiência importam. Se um modelo é treinado ou disponibilizado em dezenas de milhares de aceleradores, alguns pontos percentuais de melhoria podem se traduzir em economias muito grandes. Energia, refrigeração, utilização, movimentação de memória, redes e tempo ocioso passam a ser questões de negócio, não apenas questões de engenharia.
É por isso que um chip personalizado pode ser valioso mesmo que nunca substitua todos os fornecedores externos.
Ele dá à Anthropic mais uma alavanca. Pode reduzir custos para cargas de trabalho específicas. Pode melhorar seu poder de negociação com parceiros de nuvem e de chips. Também pode permitir que a Anthropic otimize o hardware em torno da forma exata como seus próprios modelos funcionam, em vez de adaptar esses modelos ao acelerador de uso geral que estiver disponível.
Nesse sentido, o esforço relatado em chips não é uma contradição da estratégia multiplataforma da Anthropic. Pode ser uma extensão dela.
A OpenAI já percorreu esse caminho
O artigo original compara a posição relatada da Anthropic com o caminho da OpenAI em silício personalizado.
A OpenAI começou a trabalhar com a Broadcom em aceleradores de IA personalizados antes de apresentar o Jalapeño, um chip de IA focado em inferência e construído em torno de cargas de trabalho de grandes modelos de linguagem. O anúncio oficial da OpenAI descreveu o Jalapeño como seu primeiro Processador de Inteligência e parte de uma plataforma de computação multigeracional com a Broadcom.

A comparação importa porque a OpenAI já está mais avançada nesse caminho. A empresa anunciou uma colaboração de 10 gigawatts com a Broadcom para aceleradores de IA personalizados e, posteriormente, apresentou o Jalapeño como um chip projetado especificamente para inferência de LLMs. A OpenAI também disse que o chip foi codesenvolvido do projeto inicial ao tape-out em nove meses, acelerado em parte por seus próprios modelos.
Esse último ponto é especialmente importante. As empresas de IA já não estão apenas comprando chips para executar IA. Elas estão começando a usar IA para ajudar a projetar os chips que executarão os futuros sistemas de IA.
Isso cria um efeito de volante. Modelos melhores ajudam a projetar uma infraestrutura melhor. Uma infraestrutura melhor reduz o custo e a latência de execução dos modelos. Custos mais baixos tornam possível mais uso. Mais uso gera mais dados, mais receita e mais pressão para construir a próxima geração de infraestrutura.
A Anthropic parece estar em um ponto muito mais inicial do que a OpenAI estava quando o Jalapeño se tornou público. Com base no relatório original, a Anthropic ainda está definindo o que o chip deve fazer e como ele se encaixaria no restante de sua pilha de computação. Esse é o começo de um longo caminho, não o fim.
Alguém pode realmente desafiar a NVIDIA?
O artigo original termina com a maior pergunta da infraestrutura de IA: chips personalizados podem desafiar a NVIDIA de forma significativa?
A resposta é mais complicada do que “sim” ou “não”.
A NVIDIA continua sendo a força dominante em aceleração de IA, especialmente porque não vende apenas chips. Ela vende uma plataforma madura: GPUs, redes, software, bibliotecas, sistemas e familiaridade para desenvolvedores. Para muitas equipes de IA, a NVIDIA ainda é a forma mais rápida e de menor risco de escalar.

É por isso que chips personalizados não devem ser vistos como uma simples tentativa de “matar a NVIDIA”. Para empresas como Google, Amazon,
Microsoft, Meta, OpenAI e agora possivelmente a Anthropic — o ponto geralmente é mais específico.
Elas querem uma economia melhor para suas próprias cargas de trabalho. Querem mais controle sobre o fornecimento. Querem maior poder de negociação. Querem a capacidade de otimizar toda a pilha, da arquitetura do modelo ao serviço de inferência e ao projeto do data center.
Em outras palavras, chips personalizados talvez não dominem o mercado da NVIDIA da noite para o dia. Mas podem reformular a economia das empresas que operam na maior escala.
Para a Anthropic, um chip personalizado seria mais uma opção de longo prazo. A empresa pode continuar usando AWS Trainium, TPUs do Google e GPUs da NVIDIA, ao mesmo tempo em que desenvolve expertise interna em chips. Se o projeto funcionar, ela ganha eficiência e poder de negociação. Se não funcionar, a estratégia multiforncedor existente ainda dá à Anthropic espaço para escalar.
O que isso significa para a corrida da infraestrutura de IA
A indústria de IA está entrando em uma fase em que as empresas de modelos já não são apenas empresas de software. Os principais laboratórios também estão se tornando empresas de infraestrutura.
Na era anterior, os fabricantes de chips definiam em grande parte o formato da computação, e as empresas de software construíam sobre esse hardware. Na era da IA, essa relação está começando a se inverter. As empresas que desenvolvem modelos de fronteira definem cada vez mais o que precisam de chips, memória, redes, energia, resfriamento e data centers.
As negociações da Anthropic com a Samsung, conforme relatado, se encaixam nesse padrão mais amplo.
O projeto talvez nunca chegue à produção em massa. A Samsung pode ou não se tornar a parceira de fabricação. A arquitetura final do chip, se houver uma, pode ser muito diferente do que está sendo discutido agora. Mas a direção estratégica é clara: empresas de IA de fronteira querem mais controle sobre a infraestrutura física por trás da inteligência.
Quanto mais caro se torna oferecer inteligência como serviço, maior é o incentivo para possuir uma parcela maior da pilha.
Nota sobre as fontes
Este artigo é baseado no artigo original da BAAI / 新智元 e nas referências listadas por ele. A discussão relatada sobre o chip personalizado da Anthropic com a Samsung é baseada em reportagens de terceiros e deve ser tratada como um projeto de hardware em estágio inicial e não confirmado, a menos que a Anthropic ou a Samsung o anuncie formalmente.
Nenhum bloco de código, etapa de linha de comando, arquivo de configuração ou tabela técnica foi encontrado no artigo original. O artigo original continha vários logotipos de plataformas, imagens promocionais, imagens de QR code/contato e banners decorativos; esses elementos foram removidos de acordo com as regras de publicação. Uma imagem original relacionada à OpenAI na página da BAAI não pôde ser obtida de forma confiável, portanto foi usada, em seu lugar, a imagem oficial da OpenAI do anúncio relevante do Jalapeño.
Fonte original: https://hub.baai.ac.cn/view/56077
Perguntas frequentes
O que a Anthropic estaria planejando com um chip de IA personalizado?
Segundo relatos, a Anthropic está explorando um projeto de chip de IA personalizado em estágio inicial e discutiu possíveis opções de fabricação com a Samsung. O chip não foi confirmado publicamente como um produto final, e o objetivo do design ainda não está claro.
Por que a Anthropic construiria seu próprio chip de IA se já usa AWS Trainium, TPUs do Google e GPUs da NVIDIA?
Um chip personalizado poderia ajudar a Anthropic a melhorar a eficiência para cargas de trabalho específicas e obter mais controle sobre custos e fornecimento. Isso também dá à empresa maior poder de negociação ao trabalhar com grandes fornecedores de nuvem e chips.
O que significa Samsung 2 nm neste contexto?
Samsung 2 nm refere-se a um processo avançado de fabricação de semicondutores. Em teoria, um processo mais avançado pode viabilizar designs de chips mais densos e com maior eficiência energética, embora o desempenho no mundo real dependa da arquitetura completa, do encapsulamento, da memória e do design do sistema.
Por que o encapsulamento avançado é importante para chips de IA?
As cargas de trabalho de IA movimentam enormes quantidades de dados entre processadores e memória. O encapsulamento avançado pode aproximar a computação e a memória de alta largura de banda, melhorando a movimentação de dados e reduzindo o desperdício de tempo e energia.
A Anthropic está tentando substituir a NVIDIA?
Não necessariamente. A interpretação mais realista é que a Anthropic quer mais uma opção em sua estratégia de computação. As GPUs da NVIDIA podem continuar sendo importantes, enquanto chips personalizados ajudam em cargas de trabalho específicas, controle de custos e flexibilidade da cadeia de suprimentos.
Como o chip Jalapeño da OpenAI se relaciona com esta história?
O Jalapeño da OpenAI mostra como um grande laboratório de IA pode avançar mais profundamente em silício personalizado para cargas de trabalho de inferência. A comparação é importante porque a Anthropic pode agora estar iniciando uma jornada semelhante, embora pareça estar em um estágio muito mais inicial do processo.
O chip da Anthropic está pronto para produção?
Nenhuma evidência pública sugere que a Anthropic tenha um chip pronto para produção. Com base no relatório original, o projeto ainda está em estágio inicial, e decisões importantes de design e implantação ainda não foram finalizadas.
Ferramentas relacionadas
- Anthropic: A empresa de IA por trás do Claude e da exploração relatada de um chip personalizado.
- AWS Trainium: A família de aceleradores de IA da Amazon criada especificamente para cargas de trabalho de treinamento e inferência.
- Google Cloud TPU: A plataforma de unidades de processamento tensorial do Google para treinamento e inferência de IA em larga escala.
- Samsung Foundry: O negócio de fabricação de semicondutores da Samsung, incluindo serviços de processos avançados e encapsulamento.
- Broadcom: A
empresa de semicondutores e redes envolvida em infraestrutura de aceleradores de IA personalizados.
- OpenAI: A empresa de IA que apresentou o chip de inferência Jalapeño em parceria com a Broadcom.
Links relacionados
- Artigo original da BAAI: O artigo-fonte usado para esta reescrita em inglês.
- The Information: Anthropic em conversas com a Samsung: A reportagem original com acesso pago citada pelo artigo-fonte.
- Parceria de computação da Anthropic com Google e Broadcom: O anúncio oficial da Anthropic sobre vários gigawatts de capacidade de TPUs de próxima geração.
- Anúncio da Samsung sobre GAA de 2 nm e encapsulamento 2.5D: Publicação oficial da redação da Samsung sobre GAA de 2 nm e encapsulamento 2.5D para a Preferred Networks.
- Chip de inferência Jalapeño da OpenAI e Broadcom: Anúncio oficial da OpenAI sobre seu chip de inferência otimizado para LLMs.
- Colaboração de 10 GW entre Broadcom e OpenAI: Anúncio oficial da Broadcom para investidores sobre a parceria de aceleradores personalizados com a OpenAI.
- Visão geral do AWS Trainium: Documentação e visão geral do produto da AWS para chips de IA Trainium.
- Documentação do Google Cloud TPU: Documentação oficial sobre a arquitetura e o uso das TPUs do Google Cloud.
Resumo
Segundo relatos, a Anthropic está explorando um chip de IA personalizado e discutiu possíveis opções de fabricação com a Samsung, incluindo tecnologia avançada de processo de 2 nm e encapsulamento. O projeto parece estar em estágio inicial, mas se encaixa na mudança mais ampla na infraestrutura de IA: empresas de modelos querem cada vez mais controle sobre o hardware que alimenta seus sistemas.
A iniciativa não significa necessariamente que a Anthropic esteja abandonando o AWS Trainium, as TPUs do Google ou as GPUs da NVIDIA. Em vez disso, aponta para uma estratégia de longo prazo: usar múltiplos caminhos de computação, reduzir riscos de fornecimento e melhorar a eficiência de custos em escala de fronteira.
O chip Jalapeño da OpenAI mostra que o silício personalizado está se tornando parte do manual da IA de fronteira. A Anthropic pode agora estar dando os primeiros passos por um caminho semelhante.
O ponto principal: chips de IA personalizados já não são apenas uma história de empresas de hardware; eles estão se tornando uma estratégia central para os maiores laboratórios de IA.