L'article « La puce à 20 milliards de dollars de NVIDIA pourrait rendre ChatGPT lent » est paru sur BitcoinEthereumNews.com. Le géant des puces NVIDIA s'apprête à dévoiler une nouvelle puce artificielle puissanteL'article « La puce à 20 milliards de dollars de NVIDIA pourrait rendre ChatGPT lent » est paru sur BitcoinEthereumNews.com. Le géant des puces NVIDIA s'apprête à dévoiler une nouvelle puce artificielle puissante

La puce à 20 milliards $ de NVIDIA pourrait faire paraître ChatGPT lent

2026/03/14 15:29
Temps de lecture : 5 min
Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : [email protected]

Le géant des puces NVIDIA se prépare à dévoiler un nouveau processeur d'intelligence artificielle puissant conçu pour accélérer la manière dont les chatbots et autres outils d'IA génèrent des réponses, pouvant potentiellement faire paraître les systèmes actuels comme ChatGPT lents en comparaison.

La nouvelle plateforme, qui devrait faire ses débuts lors de la conférence annuelle des développeurs GTC de NVIDIA, est optimisée pour l'inférence IA, l'étape où les modèles entraînés produisent des réponses aux invites des utilisateurs. Contrairement aux GPU traditionnels conçus pour gérer à la fois l'entraînement et l'inférence, le processeur à venir se concentre spécifiquement sur la fourniture de réponses plus rapides et plus efficaces.

Le produit, s'il est lancé, marquera le premier résultat tangible de l'accord de décembre qui a intégré les fondateurs de Groq, dont l'entreprise est spécialisée dans le matériel de traitement IA haute vitesse.

Fin de l'année dernière, NVIDIA aurait dépensé environ 20 milliards de dollars pour obtenir une licence de technologie de la startup de puces Groq et recruter du personnel clé, y compris son PDG. À peu près au même moment, le PDG de NVIDIA, Jensen Huang, a déclaré aux employés : "Nous prévoyons d'intégrer les processeurs à faible latence de Groq dans l'architecture NVIDIA AI factory, étendant la plateforme pour servir une gamme encore plus large de charges de travail d'inférence IA et en temps réel."

Désormais, la nouvelle puce d'inférence devrait gérer des requêtes IA complexes à haute vitesse, avec OpenAI et d'autres clients de premier plan susceptibles de l'adopter, selon The Wall Street Journal. Son rapport a également montré que la nouvelle puce pourrait gérer près de 10 % de la charge de travail d'inférence d'OpenAI.

La puce de type Groq utilisera la SRAM, selon des sources

Lors d'un récent appel aux résultats, le PDG de NVIDIA a laissé entendre que plusieurs nouveaux produits seront dévoilés lors du prochain événement GTC, souvent décrit comme le "Super Bowl de l'IA". Il avait remarqué : "J'ai de grandes idées que j'aimerais partager avec vous au GTC." 

La plupart des analystes conviennent que la puce de type Groq pourrait faire partie de la gamme. Ils ont également déclaré que sa conception pourrait éclairer la manière dont NVIDIA vise à résoudre les contraintes de mémoire dans le calcul d'inférence. Ces plateformes fonctionnent généralement sur une mémoire à large bande passante (HBM). Cependant, la HBM a été difficile à se procurer dernièrement.

Des initiés ont affirmé que l'entreprise prévoit d'utiliser la SRAM dans la puce plutôt que la RAM dynamique associée à la HBM. Idéalement, la SRAM est plus accessible et peut améliorer les performances des charges de travail de raisonnement IA.

Si la puce est dévoilée, cela pourrait être un grand pas en avant pour l'entreprise de puces et les modèles entraînés par IA. Cependant, en parlant de son lancement possible, Sid Sheth, fondateur et PDG de d-Matrix, a jeté une ombre sur son développement. Il a noté que bien que NVIDIA reste le leader incontesté de la formation en IA, l'inférence représente un paysage très différent. Il a partagé : "Les développeurs peuvent se tourner vers des concurrents autres que NVIDIA car l'exécution de modèles d'IA terminés ne nécessite pas le même type de programmation que leur entraînement." 

Néanmoins, d'autres géants de la technologie font également progresser le calcul d'inférence. Meta a dévoilé cette semaine quatre processeurs adaptés à l'inférence, incitant un investisseur de la Silicon Valley à dire que l'industrie pourrait entrer dans une phase non "dominée par NVIDIA".

Cependant, plus récemment, June Paik, directeur général de FuriosaAI, un rival de NVIDIA, commentant l'avantage du calcul d'inférence facilement déployable, a mis en garde que la plupart des centres de données ne peuvent pas accueillir les derniers GPU refroidis par liquide.

Néanmoins, malgré ses inquiétudes, les analystes de Bank of America s'attendent à ce que les charges de travail d'inférence représentent 75 % des dépenses des centres de données IA d'ici 2030, lorsque le marché atteindra environ 1,2 billion de dollars, contre environ 50 % l'année dernière. Ben Bajarin, analyste technologique chez Creative Strategies, a également affirmé que les centres de données du futur ne se conformeront pas à un modèle unique, anticipant que les entreprises adopteront différentes approches pour le développement des puces et des installations.

NVIDIA devrait sortir les puces Vera Rubin plus tard en 2026

NVIDIA a également récemment lancé ses puces IA de nouvelle génération, les puces IA Vera Rubin, anticipant que l'essor des plateformes d'IA de raisonnement telles que DeepSeek alimentera une demande informatique encore plus importante. Elle a affirmé que les puces aideraient à entraîner de plus grands modèles d'IA et à fournir des résultats plus sophistiqués à une base d'utilisateurs plus large. 

Selon Huang, Rubin arrivera également sur le marché au second semestre 2026, avec une version haut de gamme "ultra" prévue pour 2027.

Il a également expliqué qu'un seul système Rubin combinerait 576 GPU individuels en une seule puce. Actuellement, la puce Blackwell de NVIDIA regroupe 72 GPU dans son système NVL72, ce qui signifie que Rubin disposera d'une mémoire plus avancée.

Source : https://www.cryptopolitan.com/nvidias-chip-could-make-chatgpt-look-slow/

Opportunité de marché
Logo de Gitcoin
Cours Gitcoin(GTC)
$0.09431
$0.09431$0.09431
-5.92%
USD
Graphique du prix de Gitcoin (GTC) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Un gestionnaire de fonds sud-africain appelle à la prudence concernant l'ETF Bitcoin

Un gestionnaire de fonds sud-africain appelle à la prudence concernant l'ETF Bitcoin

Le post Un gestionnaire de fonds sud-africain appelle à la prudence concernant les ETF Bitcoin est apparu sur BitcoinEthereumNews.com. Sygnia Ltd., une société de gestion d'actifs sud-africaine de 20 milliards de dollars, conseille aux investisseurs de limiter leur exposition au Bitcoin, malgré des entrées robustes dans son nouveau fonds crypto. Sygnia a lancé son ETF Bitcoin, le fonds Sygnia Life Bitcoin Plus, en juin. La société a explicitement recommandé aux clients de n'allouer pas plus de 5% de leurs actifs discrétionnaires ou de rente de retraite au fonds, qui suit l'ETF iShares Bitcoin Trust. Sponsorisé Sponsorisé Le gestionnaire de fonds conseille la prudence peu après le lancement du produit Alors que la demande d'actifs numériques augmente en Afrique du Sud, signalant un intérêt croissant des investisseurs particuliers et institutionnels, la société a émis des directives. Elle contacte également activement les clients qui tentent d'allouer l'intégralité de leurs portefeuilles au fonds, les avertissant de l'extrême volatilité de l'actif. La société a également réitéré que les investisseurs ne devraient pas dépasser l'allocation recommandée de 5% des actifs discrétionnaires ou de rente de retraite au fonds. Cela s'explique par le fait que le Bitcoin a enregistré des gains substantiels au cours de l'année écoulée, augmentant de plus de 80%, mais les prix restent volatils, chutant de plus de 2,4% au cours de la semaine dernière. "Notre rôle est d'empêcher les investisseurs de prendre des risques disproportionnés", a déclaré Magda Wierzycka, PDG de Sygnia, dans une interview à Bloomberg TV le 22 septembre. "Le Bitcoin est passionnant, mais ce n'est pas un chemin garanti vers la richesse. Il nécessite une gestion prudente au sein d'un portefeuille diversifié." Les marchés émergents pourraient faire face à une plus grande volatilité Le paysage financier de l'Afrique du Sud va changer considérablement alors que de nouveaux ETF Bitcoin attendent l'approbation réglementaire. Ces offres vont probablement stimuler l'adoption des actifs numériques dans le pays, mais les analystes exhortent à la discipline des investisseurs. Les analystes préviennent que les marchés émergents comme l'Afrique du Sud pourraient faire face à une volatilité accrue. Sponsorisé Sponsorisé Le gestionnaire de fonds prévoit d'introduire des ETF crypto supplémentaires à la Bourse de Johannesburg une fois l'approbation réglementaire obtenue. La prudence découle de la vulnérabilité inhérente de ces marchés aux fluctuations soudaines des prix, une réalité...
Partager
BitcoinEthereumNews2025/09/23 10:51
Microsoft (MSFT) devient le premier fournisseur de cloud à valider la puce IA la plus puissante de Nvidia

Microsoft (MSFT) devient le premier fournisseur de cloud à valider la puce IA la plus puissante de Nvidia

TLDR Microsoft Azure est le premier fournisseur de cloud à commencer la validation du système Nvidia Vera Rubin NVL72. Le PDG Satya Nadella a annoncé cette étape importante sur X (anciennement Twitter
Partager
Coincentral2026/03/14 16:46
Stanley Druckenmiller prévoit une domination des stablecoins dans les systèmes de paiement mondiaux d'ici une décennie

Stanley Druckenmiller prévoit une domination des stablecoins dans les systèmes de paiement mondiaux d'ici une décennie

Le milliardaire Stanley Druckenmiller prédit que les stablecoins domineront les paiements mondiaux dans 10 à 15 ans alors que la capitalisation boursière atteint un record de 300 milliards de dollars, bien qu'il reste sceptique
Partager
Blockonomi2026/03/14 15:59