Name: Doppler VPN
Brand: Doppler VPN
Price: 6.99 USD
Availability: InStock

Huawei lance la carte accélératrice Atlas 350 pour l'IA

Le géant technologique chinois Huawei Technologies a dévoilé la carte accélératrice Atlas 350 pour l'inférence en IA, propulsée par sa puce Ascend 950PR. Annoncée lors de la China Partner Conference de Huawei, la société affirme que l'Atlas 350 offre une puissance de calcul supérieure pour les applications d'intelligence artificielle et vise à atteindre la parité ou de meilleures performances que le H20 de son rival américain Nvidia sur les tâches d'inférence.

Principales revendications et chiffres

L'Atlas 350 offre 1,56 pétaflops de puissance de calcul FP4, selon Huawei.
Huawei indique que cela représente une amélioration de 2,8 fois par rapport à la puce H20 adaptée à la Chine de Nvidia (métrique FP4), d'après Zhang Dixuan, responsable de l'activité Ascend en matière de calcul chez Huawei.
Ma Haixu, vice-président chez Huawei, a déclaré que la carte est propulsée par la puce Ascend 950PR de l'entreprise, conçue pour augmenter la puissance de calcul et le stockage pour l'inférence en IA.

FP4 fait référence à un format à virgule flottante basse précision qui permet aux accélérateurs de déplacer les données plus rapidement, ce qui le rend utile pour les charges de travail d'inférence où le débit est important.

Charges de travail cibles et positionnement

Huawei positionne l'Atlas 350 comme un accélérateur axé sur l'inférence pour des cas d'utilisation incluant :

recommandation dans la recherche
génération multimodale
grands modèles de langage (inférence et tâches associées)

Zhang Dixuan a déclaré que la carte vise à égaler ou dépasser ses pairs en matière de performances d'inférence pour ces applications. Une carte accélératrice est une unité matérielle dédiée conçue pour être intégrée dans un serveur pour des tâches de calcul spécialisées.

Contexte : puces développées en interne et sanctions américaines

Protégez votre vie privée avec Doppler VPN

3 jours d'essai gratuit. Sans inscription. Sans journaux.

Télécharger l'app

Le lancement intervient alors que la société sanctionnée par les États-Unis intensifie ses efforts dans l'infrastructure de calcul pour l'IA basée sur ses semi-conducteurs développés en interne. Huawei a investi dans ses puces Ascend et d'autres avancées en matière de puces ces dernières années pour réduire sa dépendance à la technologie américaine.

En septembre, Huawei a dévoilé l'Ascend 950PR dans le cadre d'une feuille de route triennale pour son ambition Ascend ; le 950PR a été décrit comme conçu pour le préremplissage et la recommandation — le préremplissage étant une étape fondamentale de l'inférence des modèles d'IA qui garantit que les jetons d'entrée sont traités efficacement.

Améliorations du stockage et stratégie matérielle plus large

En parallèle de l'annonce de l'Atlas 350, Huawei a déclaré qu'elle procéderait à des mises à jour majeures de ses produits de stockage en 2026. Les mises à jour et lancements prévus comprennent :

systèmes All-flash OceanStor Dorado et Pacific 9926 pour le stockage de niveau entreprise
armoire FusionCube A1000 pour permettre un déploiement rapide de l'IA pour les petites et moyennes entreprises

Yuan Yuan, président de la gamme de produits de stockage de données de Huawei, a encadré la stratégie de l'entreprise : « Alors que la première moitié de l'ère de l'IA était axée sur la puissance de calcul, la seconde moitié sera définie par les données. » Il a déclaré que Huawei continuerait de mettre à niveau ses lignes de produits de stockage en 2026 et resterait étroitement impliqué dans les principaux projets nationaux d'infrastructure de données.

Ce que cela signifie

L'Atlas 350 de Huawei — construit autour de l'Ascend 950PR — signale la volonté de l'entreprise de concurrencer plus directement Nvidia sur l'inférence en IA, en particulier en Chine et auprès des clients cherchant des solutions non dépendantes des États-Unis. En mettant l'accent sur les performances FP4 et des mises à niveau de stockage intégrées, Huawei répond aux demandes accrues en calcul et en données des systèmes d'IA agents qui exigent à la fois une inférence rapide et une gestion importante des données.

Publié : 21h00, 20 mars 2026 | Iris Deng, Shenzhen

Sources :

scmp.com