Secondo indiscrezioni, Anthropic sta esplorando un proprio chip AI: trattative con Samsung sui 2 nm, talenti da OpenAI e la prossima guerra del calcolo
Secondo indiscrezioni, Anthropic sta esplorando un chip AI personalizzato e ha discusso possibili opzioni di produzione con Samsung, incluse tecnologie avanzate di processo a 2 nm e di packaging. Il progetto sembra essere in una fase iniziale, ma si inserisce nel più ampio cambiamento dell’infrastruttura AI: le aziende che sviluppano modelli vogliono sempre più controllo sull’hardware che alimenta i loro sistemi. Questa mossa non significa necessariamente che Anthropic stia abbandonando AWS Trainium, le TPU di Google o le GPU NVIDIA. Indica piuttosto una strategia di più lungo periodo: utilizzare più percorsi di calcolo, ridurre i rischi di approvvigionamento e migliorare l’efficienza dei costi su scala frontier. Il chip Jalapeño di OpenAI dimostra che il silicio personalizzato sta diventando parte del manuale operativo dell’AI di frontiera. Anthropic potrebbe ora muovere i primi passi lungo una strada simile. **Il punto principale: i chip AI personalizzati non sono più solo una questione da aziende hardware; stanno diventando una strategia centrale per i più grandi laboratori di AI.**

Secondo quanto riferito, Anthropic sta esplorando un proprio chip AI: trattative con Samsung sui 2 nm, talenti da OpenAI e la prossima guerra del calcolo
Introduzione
Anthropic si è da tempo presentata come un’azienda che non vuole dipendere da un unico percorso hardware. La sua strategia di calcolo è stata costruita attorno a una combinazione di AWS Trainium, Google TPU e GPU NVIDIA. Questo approccio multipiattaforma offre al produttore di Claude una maggiore flessibilità rispetto a una strategia incentrata esclusivamente su NVIDIA.
Ma recenti indiscrezioni suggeriscono che Anthropic potrebbe ora guardare a una quarta carta: un proprio chip AI personalizzato.
Secondo l’articolo originale, The Information ha riferito che Anthropic ha avviato i primi lavori su un chip AI personalizzato e ha discusso potenziali opzioni di produzione con Samsung Electronics. Le opzioni segnalate includono il processo a 2 nm di Samsung e il packaging avanzato, entrambi estremamente rilevanti per i moderni acceleratori AI.

Questo non significa che Anthropic sia pronta a sostituire i suoi attuali fornitori di capacità di calcolo. Il progetto viene ancora descritto come in fase iniziale. Lo scopo del chip, le prestazioni target, l’integrazione nei server e il piano di distribuzione nei cluster non sono stati ancora definiti. Tuttavia, la direzione è chiara: man mano che l’AI di frontiera diventa sempre più costosa da addestrare e da servire, i più grandi laboratori di AI vengono spinti sempre più in profondità nello stack hardware.
Secondo quanto riferito, Anthropic sta parlando con Samsung di un chip AI personalizzato
Il punto centrale del rapporto è semplice ma importante: secondo quanto riferito, Anthropic ha iniziato a esplorare in fase preliminare un proprio chip AI e ha avviato discussioni con Samsung sulla produzione.

Le opzioni in discussione includerebbero il processo a 2 nm di Samsung e il packaging avanzato. Nell’hardware per l’AI, questi due aspetti contano moltissimo.
Un nodo di processo più piccolo può inserire più transistor in un’area del chip simile, migliorando la possibilità di ottenere prestazioni più elevate e una migliore efficienza energetica. Il packaging avanzato è altrettanto importante. I moderni chip AI devono spesso spostare enormi quantità di dati tra unità di calcolo e memoria ad alta larghezza di banda. Quanto più breve e veloce diventa questo percorso dei dati, tanto meno tempo il chip spreca in attesa della memoria.
Nel luglio 2024, Samsung ha annunciato una soluzione semiconduttore chiavi in mano per Preferred Networks che combinava il suo processo GAA a 2 nm con il packaging 2.5D. L’articolo originale indica questa soluzione come il tipo di combinazione di produzione e packaging che Anthropic potrebbe stare valutando.

Per ora, si tratta ancora di una discussione riportata da fonti, non di una roadmap di prodotto confermata da Anthropic. La posizione pubblica di Anthropic resta che AWS Trainium, Google TPU e GPU NVIDIA rimangono centrali nel modo in cui l’azienda scala la capacità di calcolo.
Ed è proprio questo a rendere interessante la storia. Anthropic non è un’azienda priva di partner per il calcolo. Ne ha già diversi. Se sta comunque esplorando un chip personalizzato, probabilmente il motivo non è una sostituzione a breve termine. È una leva strategica di lungo periodo.
Due segnali: assunzioni e discussioni con una fonderia
L’articolo originale evidenzia due mosse che rendono il rapporto più significativo.
La prima è l’assunzione di personale. Secondo quanto riferito, Anthropic avrebbe assunto Clive Chan, uno dei primi membri del team di OpenAI dedicato ai chip personalizzati. In precedenza aveva lavorato anche al progetto del supercomputer Dojo di Tesla. Assunzioni hardware di questo tipo di solito non avvengono per caso. Sono un segnale che l’azienda vuole sviluppare competenze interne, non solo accedere a fornitori esterni.

Il secondo segnale è la stessa discussione con Samsung riportata dalle fonti. Precedenti indiscrezioni avevano già suggerito che Anthropic stesse valutando chip personalizzati come uno dei modi per affrontare la scarsità di capacità di calcolo. Passare dal “pensare ai chip” al “parlare con un potenziale partner produttivo” suggerisce che l’idea si sia avvicinata almeno di un passo alla valutazione pratica.
Tuttavia, il divario tra un progetto di chip in fase iniziale e un acceleratore AI distribuito è enorme. Prima che un chip possa contare davvero in produzione, un’azienda deve definire il carico di lavoro, progettare l’architettura, validare il silicio, assicurarsi il packaging
capacità, costruire schede e server, integrare il networking e dimostrare che l’intero sistema può funzionare su scala di cluster.
Questo processo richiede tempo. E richiede anche molto denaro.
La quarta carta imposta dal conto del calcolo
Per capire perché Anthropic potrebbe anche solo prendere in considerazione questa strada, bisogna partire dalle dimensioni del problema del calcolo.
L’articolo originale richiama la crescita estremamente rapida dei ricavi di Anthropic e la pressione che tale crescita esercita sull’infrastruttura. Più clienti usano Claude, maggiore è la capacità di training e inferenza di cui l’azienda ha bisogno. Un’adozione più rapida del prodotto non crea soltanto una curva dei ricavi. Crea un conto del calcolo.
L’annuncio ufficiale di Anthropic dell’aprile 2026 affermava che l’azienda aveva ampliato la propria partnership con Google e Broadcom per diversi gigawatt di capacità TPU di nuova generazione, prevista in entrata in funzione a partire dal 2027. Lo stesso annuncio affermava che Anthropic esegue Claude su AWS Trainium, TPU di Google e GPU NVIDIA, con Amazon che rimane il suo principale fornitore cloud e partner per il training.

La strategia è facile da comprendere: usare diverse piattaforme hardware per carichi di lavoro diversi, ridurre il rischio legato a un singolo fornitore e mantenere resilienti i sistemi critici.
Ma su scala di frontiera, anche piccoli miglioramenti di efficienza contano. Se un modello viene addestrato o servito su decine di migliaia di acceleratori, pochi punti percentuali di miglioramento possono tradursi in risparmi molto elevati. Energia, raffreddamento, utilizzo, spostamento della memoria, networking e tempi di inattività diventano tutti questioni di business, non soltanto questioni ingegneristiche.
Ecco perché un chip personalizzato può essere prezioso anche se non sostituisce mai tutti i fornitori esterni.
Offre ad Anthropic un’altra leva. Può ridurre i costi per carichi di lavoro specifici. Può migliorare il potere negoziale con i partner cloud e i produttori di chip. Può anche consentire ad Anthropic di ottimizzare l’hardware intorno al modo esatto in cui funzionano i propri modelli, invece di adattare quei modelli a qualunque acceleratore general purpose sia disponibile.
In questo senso, lo sforzo riportato sul chip non è una contraddizione della strategia multi-piattaforma di Anthropic. Potrebbe esserne un’estensione.
OpenAI ha già percorso questa strada
L’articolo originale confronta la posizione riportata di Anthropic con il percorso di OpenAI nel silicio personalizzato.
OpenAI ha iniziato a lavorare con Broadcom su acceleratori AI personalizzati prima di presentare Jalapeño, un chip AI focalizzato sull’inferenza e costruito attorno ai carichi di lavoro dei grandi modelli linguistici. L’annuncio ufficiale di OpenAI descriveva Jalapeño come il suo primo Intelligence Processor e come parte di una piattaforma di calcolo multi-generazione con Broadcom.

Il confronto è importante perché OpenAI è già più avanti lungo questo percorso. L’azienda ha annunciato una collaborazione da 10 gigawatt con Broadcom per acceleratori AI personalizzati e in seguito ha presentato Jalapeño come un chip progettato specificamente per l’inferenza LLM. OpenAI ha anche affermato che il chip è stato co-sviluppato dal progetto iniziale fino al tape-out in nove mesi, accelerato in parte dai suoi stessi modelli.
Quest’ultimo punto è particolarmente importante. Le aziende di AI non stanno più soltanto acquistando chip per eseguire l’AI. Stanno iniziando a usare l’AI per aiutare a progettare i chip che eseguiranno i futuri sistemi di AI.
Questo crea un volano. Modelli migliori aiutano a progettare infrastrutture migliori. Infrastrutture migliori riducono i costi e la latenza dell’esecuzione dei modelli. Costi più bassi rendono possibile un maggiore utilizzo. Un maggiore utilizzo crea più dati, più ricavi e una maggiore pressione per costruire la prossima generazione di infrastrutture.
Anthropic sembra trovarsi in una fase molto più iniziale rispetto a OpenAI quando Jalapeño è diventato pubblico. Sulla base del rapporto originale, Anthropic sta ancora definendo che cosa il chip dovrebbe fare e come si inserirebbe nel resto del suo stack di calcolo. Questo è l’inizio di una lunga strada, non la fine.
Qualcuno può davvero sfidare NVIDIA?
L’articolo originale si chiude con la domanda più grande nell’infrastruttura AI: i chip personalizzati possono sfidare NVIDIA in modo significativo?
La risposta è più complicata di un “sì” o un “no”.
NVIDIA rimane la forza dominante nell’accelerazione AI, soprattutto perché non vende soltanto chip. Vende una piattaforma matura: GPU, networking, software, librerie, sistemi e familiarità per gli sviluppatori. Per molti team di AI, NVIDIA è ancora il modo più rapido e a minor rischio per scalare.

Ecco perché i chip personalizzati non dovrebbero essere visti come un semplice tentativo di “uccidere NVIDIA”. Per aziende come Google, Amazon,
Microsoft, Meta, OpenAI e ora forse Anthropic: di solito il punto è più specifico.
Vogliono una migliore economia per i propri carichi di lavoro. Vogliono un maggiore controllo sull’offerta. Vogliono un potere negoziale più forte. Vogliono la possibilità di ottimizzare l’intero stack, dall’architettura dei modelli al serving per l’inferenza fino alla progettazione dei data center.
In altre parole, i chip personalizzati potrebbero non conquistare dall’oggi al domani il mercato di NVIDIA. Ma possono rimodellare l’economia per le aziende che operano alla scala più ampia.
Per Anthropic, un chip personalizzato sarebbe un’ulteriore opzione di lungo periodo. L’azienda può continuare a usare AWS Trainium, le TPU di Google e le GPU NVIDIA, sviluppando al tempo stesso competenze interne sui chip. Se il progetto funziona, ottiene efficienza e leva negoziale. Se non funziona, l’attuale strategia multi-fornitore offre comunque ad Anthropic spazio per crescere.
Che cosa significa per la corsa all’infrastruttura dell’IA
L’industria dell’IA sta entrando in una fase in cui le aziende che sviluppano modelli non sono più soltanto aziende software. I principali laboratori stanno diventando anche aziende infrastrutturali.
Nell’era precedente, i produttori di chip definivano in larga misura la forma del computing, e le aziende software costruivano sopra quell’hardware. Nell’era dell’IA, il rapporto sta iniziando a invertirsi. Le aziende che costruiscono modelli di frontiera stanno definendo sempre più ciò di cui hanno bisogno in termini di chip, memoria, reti, alimentazione, raffreddamento e data center.
Le presunte trattative tra Anthropic e Samsung rientrano in questo quadro più ampio.
Il progetto potrebbe non arrivare mai alla produzione di massa. Samsung potrebbe diventare o meno il partner produttivo. L’architettura finale del chip, se mai esisterà, potrebbe essere molto diversa da quella discussa oggi. Ma la direzione strategica è chiara: le aziende di IA di frontiera vogliono un maggiore controllo sull’infrastruttura fisica alla base dell’intelligenza.
Più diventa costoso erogare intelligenza, più forte diventa l’incentivo a possedere una parte maggiore dello stack.
Nota sulle fonti
Questo articolo si basa sull’articolo originale di BAAI / 新智元 e sui riferimenti in esso elencati. La presunta discussione tra Anthropic e Samsung su un chip personalizzato si basa su resoconti di terze parti e dovrebbe essere considerata un progetto hardware in fase iniziale e non confermato, a meno che Anthropic o Samsung non lo annuncino formalmente.
Nell’articolo originale non sono stati trovati blocchi di codice, passaggi da riga di comando, file di configurazione o tabelle tecniche. L’articolo originale conteneva diversi loghi di piattaforme, immagini promozionali, immagini con QR code/contatti e banner decorativi; questi elementi sono stati rimossi secondo le regole di pubblicazione. Un’immagine originale relativa a OpenAI presente sulla pagina di BAAI non ha potuto essere recuperata in modo affidabile, quindi viene utilizzata al suo posto l’immagine ufficiale di OpenAI proveniente dal relativo annuncio di Jalapeño.
Fonte originale: https://hub.baai.ac.cn/view/56077
FAQ
Che cosa starebbe pianificando Anthropic con un chip IA personalizzato?
Secondo quanto riportato, Anthropic starebbe esplorando un progetto in fase iniziale per un chip IA personalizzato e avrebbe discusso con Samsung possibili opzioni di produzione. Il chip non è stato confermato pubblicamente come prodotto finale e l’obiettivo progettuale è ancora poco chiaro.
Perché Anthropic dovrebbe costruire un proprio chip IA se utilizza già AWS Trainium, le TPU di Google e le GPU NVIDIA?
Un chip personalizzato potrebbe aiutare Anthropic a migliorare l’efficienza per carichi di lavoro specifici e a ottenere un maggiore controllo su costi e offerta. Inoltre, darebbe all’azienda una maggiore leva negoziale nei rapporti con i principali fornitori cloud e di chip.
Che cosa significa Samsung 2 nm in questo contesto?
Samsung 2 nm si riferisce a un processo avanzato di produzione di semiconduttori. In teoria, un processo più avanzato può supportare design di chip più densi e più efficienti dal punto di vista energetico, anche se le prestazioni nel mondo reale dipendono dall’intera architettura, dal packaging, dalla memoria e dalla progettazione del sistema.
Perché il packaging avanzato è importante per i chip IA?
I carichi di lavoro IA spostano enormi quantità di dati tra processori e memoria. Il packaging avanzato può avvicinare calcolo e memoria ad alta larghezza di banda, migliorando il movimento dei dati e riducendo tempo ed energia sprecati.
Anthropic sta cercando di sostituire NVIDIA?
Non necessariamente. L’interpretazione più realistica è che Anthropic voglia un’ulteriore opzione nella propria strategia di calcolo. Le GPU NVIDIA potrebbero rimanere importanti, mentre i chip personalizzati possono aiutare con carichi di lavoro mirati, controllo dei costi e flessibilità della catena di fornitura.
In che modo il chip Jalapeño di OpenAI è collegato a questa storia?
Jalapeño di OpenAI mostra come un grande laboratorio di IA possa spingersi più a fondo nel silicio personalizzato per i carichi di lavoro di inferenza. Il confronto è rilevante perché Anthropic potrebbe ora iniziare un percorso simile, anche se sembra trovarsi in una fase molto più precoce del processo.
Il chip di Anthropic è pronto per la produzione?
Nessuna prova pubblica suggerisce che Anthropic abbia un chip pronto per la produzione. Sulla base del report originale, il progetto è ancora in una fase iniziale e le decisioni chiave su progettazione e distribuzione non sono state finalizzate.
Strumenti correlati
- Anthropic: l’azienda di IA dietro Claude e la presunta esplorazione di un chip personalizzato.
- AWS Trainium: la famiglia di acceleratori IA progettati appositamente da Amazon per carichi di lavoro di addestramento e inferenza.
- Google Cloud TPU: la piattaforma di unità di elaborazione tensoriale di Google per addestramento e inferenza IA su larga scala.
- Samsung Foundry: l’attività di produzione di semiconduttori di Samsung, inclusi servizi di processo avanzato e packaging.
- Broadcom: un’azienda di semiconduttori e infrastrutture software.
azienda di semiconduttori e networking coinvolta nell’infrastruttura per acceleratori AI personalizzati.
- OpenAI: l’azienda di AI che ha presentato il chip di inferenza Jalapeño con Broadcom.
Link correlati
- Articolo originale BAAI: l’articolo di origine utilizzato per questa riscrittura in inglese.
- The Information: Anthropic in trattative con Samsung: il report originale a pagamento citato dall’articolo di origine.
- Partnership di calcolo tra Anthropic, Google e Broadcom: l’annuncio ufficiale di Anthropic su diversi gigawatt di capacità TPU di nuova generazione.
- Annuncio Samsung su GAA a 2 nm e packaging 2.5D: il post ufficiale della newsroom di Samsung sul processo GAA a 2 nm e sul packaging 2.5D per Preferred Networks.
- Chip di inferenza Jalapeño di OpenAI e Broadcom: l’annuncio ufficiale di OpenAI del suo chip di inferenza ottimizzato per LLM.
- Collaborazione da 10 GW tra Broadcom e OpenAI: l’annuncio ufficiale di Broadcom agli investitori sulla partnership per acceleratori personalizzati con OpenAI.
- Panoramica di AWS Trainium: documentazione e panoramica del prodotto AWS per i chip AI Trainium.
- Documentazione di Google Cloud TPU: documentazione ufficiale sull’architettura e sull’uso delle TPU di Google Cloud.
Sintesi
Secondo quanto riferito, Anthropic sta esplorando un chip AI personalizzato e ha discusso possibili opzioni di produzione con Samsung, incluse tecnologie avanzate di processo a 2 nm e packaging. Il progetto sembra essere in una fase iniziale, ma si inserisce nel più ampio cambiamento dell’infrastruttura AI: le aziende che sviluppano modelli vogliono sempre più controllo sull’hardware che alimenta i loro sistemi.
Questa mossa non significa necessariamente che Anthropic stia abbandonando AWS Trainium, le TPU di Google o le GPU NVIDIA. Indica invece una strategia di più lungo periodo: utilizzare più percorsi di calcolo, ridurre il rischio di approvvigionamento e migliorare l’efficienza dei costi su scala frontier.
Il chip Jalapeño di OpenAI dimostra che il silicio personalizzato sta diventando parte del playbook dell’AI frontier. Anthropic potrebbe ora muovere i primi passi lungo una strada simile.
Il punto principale: i chip AI personalizzati non sono più solo una storia da aziende hardware; stanno diventando una strategia centrale per i più grandi laboratori di AI.