Anthropic explorerait sa propre puce d’IA : discussions avec Samsung sur le 2 nm, talents venus d’OpenAI et prochaine guerre du calcul

Anthropic explorerait la conception d’une puce d’IA personnalisée et aurait discuté avec Samsung de possibles options de fabrication, notamment d’un procédé avancé en 2 nm et de technologies de packaging. Le projet semble encore à un stade précoce, mais il s’inscrit dans une évolution plus large de l’infrastructure d’IA : les entreprises spécialisées dans les modèles veulent de plus en plus contrôler le matériel qui alimente leurs systèmes. Cette initiative ne signifie pas nécessairement qu’Anthropic abandonne AWS Trainium, les TPU de Google ou les GPU de NVIDIA. Elle indique plutôt une stratégie à plus long terme : utiliser plusieurs voies de calcul, réduire les risques d’approvisionnement et améliorer l’efficacité des coûts à l’échelle des modèles de pointe. La puce Jalapeño d’OpenAI montre que le silicium personnalisé devient un élément du manuel stratégique de l’IA de pointe. Anthropic pourrait désormais faire ses premiers pas sur une voie similaire. **Le point essentiel : les puces d’IA personnalisées ne sont plus seulement une affaire de fabricants de matériel ; elles deviennent une stratégie centrale pour les plus grands laboratoires d’IA.**

发布于 2026年7月5日•general•GEO 评分: 0•9 次阅读

puce d’IA personnalisée d’AnthropicAnthropic Samsung 2 nmmatériel d’IA d’AnthropicGAA 2 nm de Samsungconditionnement avancé des puces d’IAAWS TrainiumGoogle TPUGPU NVIDIAaccélérateur d’IA Broadcompuce Jalapeño d’OpenAIinfrastructure d’IAsilicium d’IA personnalisépuce d’inférence d’IAstratégie de calcul pour l’IA

选择语言

العربية Deutsch English Español Français Italiano 日本語 한국어 Português Русский 中文

Anthropic explorerait sa propre puce d’IA : discussions avec Samsung sur le 2 nm, talents venus d’OpenAI et prochaine guerre du calcul

Introduction

Anthropic s’est longtemps présentée comme une entreprise ne souhaitant pas dépendre d’une seule voie matérielle. Sa stratégie de calcul repose sur une combinaison d’AWS Trainium, de Google TPU et de GPU NVIDIA. Cette approche multiplateforme donne au créateur de Claude davantage de flexibilité qu’une stratégie entièrement centrée sur NVIDIA.

Mais de récents articles suggèrent qu’Anthropic pourrait désormais envisager une quatrième carte : sa propre puce d’IA sur mesure.

Selon l’article d’origine, The Information a rapporté qu’Anthropic avait commencé des travaux préliminaires sur une puce d’IA personnalisée et avait discuté d’options de fabrication potentielles avec Samsung Electronics. Les options mentionnées incluraient le procédé 2 nm de Samsung et le packaging avancé, deux éléments particulièrement importants pour les accélérateurs d’IA modernes.

Cela ne signifie pas qu’Anthropic est prête à remplacer ses fournisseurs de calcul actuels. Le projet est encore décrit comme étant à un stade précoce. L’objectif de la puce, ses performances cibles, son intégration serveur et son plan de déploiement en cluster n’ont pas encore été finalisés. Toutefois, la direction est claire : à mesure que l’entraînement et l’exploitation des modèles d’IA de pointe deviennent plus coûteux, les plus grands laboratoires d’IA sont attirés toujours plus profondément dans la pile matérielle.

Anthropic discuterait avec Samsung d’une puce d’IA personnalisée

Le cœur de l’information est simple mais important : Anthropic aurait commencé à explorer, à un stade préliminaire, sa propre puce d’IA et aurait tenu des discussions avec Samsung au sujet de sa fabrication.

Les options discutées incluraient le procédé 2 nm de Samsung et le packaging avancé. Dans le matériel d’IA, ces deux points comptent énormément.

Un nœud de gravure plus petit permet de placer davantage de transistors dans une surface de puce similaire, ce qui améliore les possibilités d’obtenir des performances plus élevées et une meilleure efficacité énergétique. Le packaging avancé est tout aussi important. Les puces d’IA modernes doivent souvent déplacer d’immenses quantités de données entre les unités de calcul et la mémoire à haute bande passante. Plus ce chemin de données est court et rapide, moins la puce perd de temps à attendre la mémoire.

En juillet 2024, Samsung a annoncé une solution semi-conducteur clé en main pour Preferred Networks, combinant son procédé 2 nm GAA avec un packaging 2,5D. L’article d’origine présente cela comme le type de combinaison de fabrication et de packaging qu’Anthropic pourrait être en train d’évaluer.

Pour l’instant, il s’agit toujours d’une discussion rapportée, et non d’une feuille de route produit confirmée par Anthropic. La position publique d’Anthropic reste que les AWS Trainium, les Google TPU et les GPU NVIDIA demeurent au cœur de la façon dont l’entreprise accroît sa capacité de calcul.

C’est précisément ce qui rend cette information intéressante. Anthropic n’est pas une entreprise dépourvue de partenaires de calcul. Elle en compte déjà plusieurs. Si elle explore malgré tout une puce personnalisée, la raison n’est probablement pas un remplacement à court terme. Il s’agit plutôt d’un levier à long terme.

Deux signaux : recrutements et discussions avec une fonderie

L’article d’origine met en avant deux mouvements qui donnent davantage de poids à cette information.

Le premier est le recrutement. Anthropic aurait embauché Clive Chan, l’un des premiers membres de l’équipe d’OpenAI chargée des puces personnalisées. Il avait également travaillé sur le projet de supercalculateur Dojo de Tesla. Ce type de recrutement matériel n’arrive généralement pas par hasard. C’est le signe que l’entreprise souhaite développer des compétences internes, et pas seulement accéder à des fournisseurs externes.

Le second signal est la discussion rapportée avec Samsung elle-même. Des articles antérieurs avaient déjà suggéré qu’Anthropic envisageait des puces personnalisées comme l’un des moyens de répondre aux pénuries de capacité de calcul. Passer de « réfléchir à des puces » à « discuter avec un partenaire de fabrication potentiel » suggère que l’idée s’est rapprochée d’au moins une étape d’une évaluation concrète.

Cela dit, l’écart entre un projet de puce à un stade précoce et un accélérateur d’IA déployé est immense. Avant qu’une puce puisse avoir un impact en production, une entreprise doit définir la charge de travail, concevoir l’architecture, valider le silicium et sécuriser le packaging.

capacité, construire des cartes et des serveurs, intégrer le réseau et prouver que le système complet peut fonctionner à l’échelle d’un cluster.

Ce processus prend du temps. Il coûte aussi beaucoup d’argent.

La quatrième carte imposée par la facture de calcul

Pour comprendre pourquoi Anthropic envisagerait même cette voie, il faut commencer par l’ampleur du problème de calcul.

L’article original souligne la croissance extrêmement rapide des revenus d’Anthropic et la pression que cette croissance exerce sur l’infrastructure. Plus les clients utilisent Claude, plus l’entreprise a besoin de capacités d’entraînement et d’inférence. Une adoption plus rapide du produit ne crée pas seulement une courbe de revenus. Elle crée une facture de calcul.

L’annonce officielle d’Anthropic d’avril 2026 indiquait que l’entreprise avait élargi son partenariat avec Google et Broadcom afin de disposer de plusieurs gigawatts de capacité TPU de nouvelle génération, dont la mise en service est prévue à partir de 2027. La même annonce précisait qu’Anthropic exécute Claude sur AWS Trainium, les TPU de Google et les GPU de NVIDIA, Amazon restant son principal fournisseur cloud et partenaire d’entraînement.

La stratégie est facile à comprendre : utiliser différentes plateformes matérielles pour différentes charges de travail, réduire le risque lié à un fournisseur unique et maintenir la résilience des systèmes critiques.

Mais à l’échelle des modèles de pointe, même de petites améliorations d’efficacité comptent. Si un modèle est entraîné ou servi sur des dizaines de milliers d’accélérateurs, quelques points de pourcentage d’amélioration peuvent se traduire par des économies très importantes. L’énergie, le refroidissement, l’utilisation, les mouvements de mémoire, le réseau et les temps d’inactivité deviennent tous des enjeux commerciaux, et pas seulement des problèmes d’ingénierie.

C’est pourquoi une puce personnalisée peut avoir de la valeur même si elle ne remplace jamais tous les fournisseurs externes.

Elle donne à Anthropic un levier supplémentaire. Elle peut réduire les coûts pour certaines charges de travail spécifiques. Elle peut améliorer son pouvoir de négociation avec ses partenaires cloud et ses fournisseurs de puces. Elle peut aussi permettre à Anthropic d’optimiser le matériel autour de la manière exacte dont ses propres modèles fonctionnent, plutôt que d’adapter ces modèles à l’accélérateur généraliste disponible.

En ce sens, l’effort rapporté autour d’une puce n’est pas une contradiction avec la stratégie multiplateforme d’Anthropic. Il pourrait en être une extension.

OpenAI a déjà emprunté cette voie

L’article original compare la position rapportée d’Anthropic avec la trajectoire d’OpenAI dans le silicium personnalisé.

OpenAI a commencé à travailler avec Broadcom sur des accélérateurs d’IA personnalisés avant de dévoiler Jalapeño, une puce d’IA axée sur l’inférence et conçue autour des charges de travail des grands modèles de langage. L’annonce officielle d’OpenAI décrivait Jalapeño comme son premier Intelligence Processor et comme un élément d’une plateforme de calcul multigénérationnelle développée avec Broadcom.

La comparaison est importante parce qu’OpenAI est déjà plus avancée sur cette voie. L’entreprise a annoncé une collaboration de 10 gigawatts avec Broadcom pour des accélérateurs d’IA personnalisés, puis a présenté Jalapeño comme une puce conçue spécifiquement pour l’inférence des LLM. OpenAI a également indiqué que la puce avait été co-développée, de la conception initiale au tape-out, en neuf mois, un processus accéléré en partie par ses propres modèles.

Ce dernier point est particulièrement important. Les entreprises d’IA n’achètent plus seulement des puces pour faire fonctionner l’IA. Elles commencent à utiliser l’IA pour aider à concevoir les puces qui feront fonctionner les futurs systèmes d’IA.

Cela crée un volant d’inertie. De meilleurs modèles aident à concevoir de meilleures infrastructures. De meilleures infrastructures réduisent le coût et la latence de l’exécution des modèles. Des coûts plus bas rendent possible une utilisation plus importante. Une utilisation plus importante génère davantage de données, davantage de revenus et davantage de pression pour construire la prochaine génération d’infrastructures.

Anthropic semble se situer à un stade beaucoup plus précoce qu’OpenAI lorsque Jalapeño a été rendu public. D’après le rapport original, Anthropic est encore en train de définir ce que la puce devrait faire et comment elle s’intégrerait au reste de sa pile de calcul. C’est le début d’un long chemin, pas la fin.

Quelqu’un peut-il vraiment défier NVIDIA ?

L’article original se termine sur la plus grande question de l’infrastructure d’IA : les puces personnalisées peuvent-elles réellement défier NVIDIA ?

La réponse est plus compliquée qu’un simple « oui » ou « non ».

NVIDIA reste la force dominante dans l’accélération de l’IA, notamment parce qu’elle ne vend pas seulement des puces. Elle vend une plateforme mature : GPU, réseau, logiciels, bibliothèques, systèmes et familiarité des développeurs. Pour de nombreuses équipes d’IA, NVIDIA reste encore le moyen le plus rapide et le moins risqué de passer à l’échelle.

C’est pourquoi les puces personnalisées ne doivent pas être considérées comme une simple tentative de « tuer NVIDIA ». Pour des entreprises comme Google, Amazon,

Microsoft, Meta, OpenAI, et désormais peut-être Anthropic : l’objectif est généralement plus précis.

Ils veulent une meilleure rentabilité pour leurs propres charges de travail. Ils veulent davantage de contrôle sur l’approvisionnement. Ils veulent un pouvoir de négociation plus fort. Ils veulent pouvoir optimiser l’ensemble de la pile, de l’architecture des modèles au service d’inférence, jusqu’à la conception des centres de données.

Autrement dit, les puces personnalisées ne prendront peut-être pas le contrôle du marché de NVIDIA du jour au lendemain. Mais elles peuvent transformer l’économie des entreprises qui opèrent à la plus grande échelle.

Pour Anthropic, une puce personnalisée constituerait une option de long terme supplémentaire. L’entreprise peut continuer à utiliser AWS Trainium, les TPU de Google et les GPU de NVIDIA, tout en développant une expertise interne dans les puces. Si le projet fonctionne, elle gagnera en efficacité et en levier de négociation. S’il échoue, la stratégie existante multi-fournisseurs donnera toujours à Anthropic une marge de manœuvre pour passer à l’échelle.

Ce que cela signifie pour la course à l’infrastructure IA

L’industrie de l’IA entre dans une phase où les entreprises de modèles ne sont plus seulement des sociétés de logiciels. Les laboratoires de premier plan deviennent aussi des entreprises d’infrastructure.

À l’époque précédente, les fabricants de puces définissaient largement la forme de l’informatique, et les entreprises de logiciels construisaient par-dessus ce matériel. À l’ère de l’IA, cette relation commence à s’inverser. Les entreprises qui développent des modèles de pointe définissent de plus en plus ce dont elles ont besoin en matière de puces, de mémoire, de réseau, d’alimentation, de refroidissement et de centres de données.

Les discussions rapportées entre Anthropic et Samsung s’inscrivent dans ce schéma plus large.

Le projet pourrait ne jamais atteindre la production de masse. Samsung pourrait devenir ou non le partenaire de fabrication. L’architecture finale de la puce, si elle existe, pourrait être très différente de ce qui est discuté aujourd’hui. Mais l’orientation stratégique est claire : les entreprises d’IA de pointe veulent davantage de contrôle sur l’infrastructure physique qui sous-tend l’intelligence.

Plus il devient coûteux de fournir de l’intelligence, plus l’incitation à posséder une plus grande partie de la pile devient forte.

Note sur les sources

Cet article est basé sur l’article original de BAAI / 新智元 et sur les références qui y sont listées. Les discussions rapportées entre Anthropic et Samsung concernant une puce personnalisée reposent sur des informations de tiers et doivent être considérées comme un projet matériel précoce et non confirmé, sauf annonce officielle d’Anthropic ou de Samsung.

Aucun bloc de code, aucune étape en ligne de commande, aucun fichier de configuration ni aucun tableau technique n’ont été trouvés dans l’article original. L’article original contenait plusieurs logos de plateformes, images promotionnelles, images de QR code/contact et bannières décoratives ; ceux-ci ont été supprimés conformément aux règles de publication. Une image originale liée à OpenAI provenant de la page BAAI n’a pas pu être récupérée de manière fiable ; l’image officielle d’OpenAI issue de l’annonce pertinente de Jalapeño est donc utilisée à la place.

Source originale : https://hub.baai.ac.cn/view/56077

FAQ

Que prévoirait Anthropic avec une puce IA personnalisée ?

Selon certaines informations, Anthropic explorerait un projet précoce de puce IA personnalisée et aurait discuté d’options de fabrication possibles avec Samsung. La puce n’a pas été confirmée publiquement comme produit final, et l’objectif de conception reste encore flou.

Pourquoi Anthropic construirait-elle sa propre puce IA si elle utilise déjà AWS Trainium, les TPU de Google et les GPU de NVIDIA ?

Une puce personnalisée pourrait aider Anthropic à améliorer l’efficacité de charges de travail spécifiques et à mieux contrôler les coûts et l’approvisionnement. Elle donnerait également à l’entreprise un plus grand levier de négociation avec les grands fournisseurs de cloud et de puces.

Que signifie Samsung 2 nm dans ce contexte ?

Samsung 2 nm désigne un procédé avancé de fabrication de semi-conducteurs. En théorie, un procédé plus avancé peut permettre des conceptions de puces plus denses et plus économes en énergie, même si les performances réelles dépendent de l’architecture complète, du packaging, de la mémoire et de la conception du système.

Pourquoi le packaging avancé est-il important pour les puces IA ?

Les charges de travail IA déplacent d’énormes quantités de données entre les processeurs et la mémoire. Le packaging avancé peut rapprocher le calcul et la mémoire à haute bande passante, améliorant les déplacements de données et réduisant le temps et l’énergie gaspillés.

Anthropic essaie-t-elle de remplacer NVIDIA ?

Pas nécessairement. L’interprétation la plus réaliste est qu’Anthropic souhaite disposer d’une option supplémentaire dans sa stratégie de calcul. Les GPU de NVIDIA pourraient rester importants, tandis que les puces personnalisées aideraient pour des charges de travail ciblées, le contrôle des coûts et la flexibilité de la chaîne d’approvisionnement.

Quel est le lien entre la puce Jalapeño d’OpenAI et cette histoire ?

Jalapeño d’OpenAI montre comment un grand laboratoire d’IA peut s’engager plus profondément dans le silicium personnalisé pour les charges de travail d’inférence. La comparaison est pertinente parce qu’Anthropic pourrait désormais commencer un parcours similaire, même si elle semble en être à un stade beaucoup plus précoce.

La puce d’Anthropic est-elle prête pour la production ?

Aucun élément public ne suggère qu’Anthropic dispose d’une puce prête pour la production. D’après le rapport original, le projet en est encore à ses débuts, et les décisions clés de conception et de déploiement n’ont pas été finalisées.

Outils associés

Anthropic : l’entreprise d’IA derrière Claude et l’exploration rapportée d’une puce personnalisée.
AWS Trainium : la famille d’accélérateurs IA conçus par Amazon pour les charges de travail d’entraînement et d’inférence.
Google Cloud TPU : la plateforme d’unités de traitement tensoriel de Google pour l’entraînement et l’inférence IA à grande échelle.
Samsung Foundry : l’activité de fabrication de semi-conducteurs de Samsung, incluant les services de procédés avancés et de packaging.
Broadcom : A

entreprise de semi-conducteurs et de réseaux impliquée dans l’infrastructure d’accélérateurs d’IA personnalisés.

OpenAI : l’entreprise d’IA qui a dévoilé la puce d’inférence Jalapeño avec Broadcom.

Liens connexes

Article original de BAAI : l’article source utilisé pour cette réécriture en anglais.
The Information : Anthropic en discussions avec Samsung : le rapport original payant cité par l’article source.
Partenariat de calcul entre Anthropic, Google et Broadcom : l’annonce officielle d’Anthropic concernant plusieurs gigawatts de capacité TPU de nouvelle génération.
Annonce de Samsung sur le GAA 2 nm et le packaging 2,5D : le communiqué officiel de Samsung sur son site d’actualités concernant le procédé GAA 2 nm et le packaging 2,5D pour Preferred Networks.
Puce d’inférence Jalapeño d’OpenAI et Broadcom : l’annonce officielle d’OpenAI concernant sa puce d’inférence optimisée pour les LLM.
Collaboration de 10 GW entre Broadcom et OpenAI : l’annonce officielle de Broadcom destinée aux investisseurs concernant le partenariat sur les accélérateurs personnalisés d’OpenAI.
Présentation d’AWS Trainium : documentation et présentation produit d’AWS pour les puces d’IA Trainium.
Documentation Google Cloud TPU : documentation officielle sur l’architecture et l’utilisation des TPU de Google Cloud.

Résumé

Anthropic explorerait la possibilité de développer une puce d’IA personnalisée et aurait discuté avec Samsung d’options de fabrication potentielles, notamment un procédé avancé en 2 nm et une technologie de packaging. Le projet semble en être à un stade précoce, mais il s’inscrit dans une évolution plus large de l’infrastructure d’IA : les entreprises qui développent des modèles veulent de plus en plus contrôler le matériel qui alimente leurs systèmes.

Cette démarche ne signifie pas nécessairement qu’Anthropic abandonne AWS Trainium, les TPU de Google ou les GPU NVIDIA. Elle indique plutôt une stratégie à plus long terme : utiliser plusieurs voies de calcul, réduire les risques d’approvisionnement et améliorer l’efficacité des coûts à l’échelle des modèles de pointe.

La puce Jalapeño d’OpenAI montre que le silicium personnalisé devient une composante du mode d’emploi de l’IA de pointe. Anthropic pourrait désormais faire ses premiers pas sur une voie similaire.

Le point essentiel : les puces d’IA personnalisées ne sont plus seulement une affaire d’entreprises de matériel ; elles deviennent une stratégie centrale pour les plus grands laboratoires d’IA.