Interconnexion optique pour la désagrégation des centres de données

La désagrégation des centres de données sépare le calcul, la mémoire, le stockage et la mise en réseau en ressources indépendantes et mutualisées au lieu de les enfermer dans des limites fixes du serveur. Cette séparation crée une nouvelle dépendance architecturale : la couche d'interconnexion entre ces pools doit fournir suffisamment de bande passante, une latence suffisamment faible et une portée suffisante pour que l'ensemble du système se comporte comme une structure coordonnée. L'interconnexion optique est la technologie de transport qui remplit de plus en plus ce rôle -, en particulier lorsque les liaisons en cuivre atteignent des limites physiques en matière de distance, de puissance et d'intégrité du signal.

Cet article explique comment l'interconnexion optique prend en charge les architectures désagrégées, dans quels domaines elle surpasse le cuivre, comment elle se rapporte aux optiques CXL et co-packagées, et quand il est pratique de l'adopter.

Disaggregated data center linked by optical fabric

Qu'est-ce que la désagrégation des centres de données ?

Dans un modèle traditionnel-centré sur le serveur, le processeur, la mémoire, le stockage et la mise en réseau sont regroupés dans un seul châssis. Vous achetez un serveur et vous obtenez un ratio fixe des quatre -, que votre charge de travail ait besoin de ce ratio ou non. La désagrégation des centres de données divise ce groupe. Chaque type de ressource est organisé dans son propre pool, et les charges de travail tirent uniquement ce dont elles ont besoin de chaque pool sur une structure partagée.

Cela est important car les charges de travail modernes sont rarement équilibrées. Un travail de formation de modèle de langage volumineux peut saturer la mémoire GPU et la bande passante est-ouest tout en touchant à peine le stockage local. Un pipeline d'analyse en temps réel-peut nécessiter une capacité de mémoire massive, mais seulement un calcul modéré. Dans une conception centrée sur le serveur-, cette inadéquation entraîne un blocage des ressources : des cycles de processeur inactifs côtoyant une mémoire épuisée ou une capacité de stockage qu'aucune charge de travail n'utilise.

LeProjet de calcul ouvert (OCP)a piloté des conceptions de racks désagrégés depuis le milieu des années 2010, et des hyperscalers comme Meta et Microsoft ont déployé un stockage et une mise en réseau désagrégés à grande échelle. L'émergence deLien Calcul Express (CXL)a étendu cette vision à la désagrégation de la mémoire, rendant l'architecture de plus en plus pratique pour un plus large éventail d'environnements.

Pourquoi les conceptions traditionnelles centrées sur les serveurs-se heurtent-elles à un mur ?

Deux forces poussent les équipes d’infrastructure vers la désagrégation : la pression d’utilisation et la pression de bande passante.

Du côté de l'utilisation, les offres groupées de serveurs fixes génèrent des déchets à grande échelle. Les recherches du secteur suggèrent qu'environ 25 % de la capacité DRAM des serveurs conventionnels reste en moyenne inutilisée, même si la mémoire représente près de la moitié du coût total des serveurs. Multipliée sur des milliers de nœuds, cette capacité bloquée représente une charge importante en capital et en énergie.

Du côté de la bande passante, les clusters de formation d'IA et les analyses-hautes performances génèrent des modèles de trafic qui diffèrent fortement des charges de diffusion traditionnelles du nord-Web-nord-sud. Ces charges de travail génèrent un trafic important est-ouest du - GPU-vers-GPU, de l'accélérateur-vers-mémoire et du nœud-vers-nœud - sur des centaines ou des milliers de points de terminaison. Les topologies traditionnelles centrées sur les serveurs avec de courts trajets en cuivre entre des boîtiers fixes n'ont pas été conçues pour ce modèle. À mesure que les vitesses de liaison passent de 400G à 800G et au-delà, les limites électriques du cuivre deviennent plus difficiles à contourner.

Comment fonctionne l'interconnexion optique dans un centre de données désagrégé ?

Une fois que les ressources de calcul, de mémoire et d'accélérateur se trouvent dans des pools distincts, la structure reliant ces pools devient la couche-critique en termes de performances. L'interconnexion optique sert cette couche en convertissant les signaux électriques en lumière, transmettant des données viamode unique-oufibre multimode, et reconversion à l'électricité à l'extrémité de réception.

La physique du transport optique lui confère des avantages structurels pour ce travail. Les signaux lumineux dans la fibre subissent beaucoup moins d'atténuation par mètre que les signaux électriques dans le cuivre, ce qui signifie que les liaisons optiques peuvent maintenir la qualité du signal sur de plus longues distances sans le conditionnement du signal gourmand en énergie (resynchroniseurs, DSP, égaliseurs) que le cuivre exige à des vitesses plus élevées. À 800 Gbit/s, le cuivre passif est pratique jusqu'à environ 3 à 5 mètres. Les câbles électriques actifs s'étendent jusqu'à peut-être 7 mètres. Les liaisons optiques s'étendent généralement sur 100 mètres à 2 kilomètres au même débit de données, et l'optique cohérente peut atteindre des dizaines de kilomètres.

Short copper links and longer optical connections

Dans une architecture désagrégée, cet avantage de portée n’est pas abstrait. Il détermine directement la distance qui sépare les pools de ressources tout en se comportant comme un système unifié. Spécifiquement:

Dans le rack :Le cuivre domine toujours pour les connexions très courtes du - serveur-au-haut-du-commutateur de rack, du GPU-au-GPU dans un plateau. À des distances inférieures à 2 à 3 mètres, le cuivre est plus simple, moins cher et présente une latence-plus faible.
Rack-à-rack (2 à 100 m) :C’est là que l’interconnexion optique devient la valeur par défaut pratique à 400G et plus. La connexion d'un rack de calcul à un pool de mémoire dans un rack adjacent ou la liaison de plateaux GPU sur une rangée nécessite généralement la densité de bande passante et la portée offertes par la fibre.Assemblages de câbles à fibres optiquesetConnectivité MPO/MTPsont standards pour ces chemins.
Pièce-à-pièce et bâtiment-à-bâtiment (100 m–10+ km) :Seul le transport optique est viable à ces distances et vitesses. Cette portée est importante pour la désagrégation-à l'échelle du campus, où les pools de stockage, le calcul de sauvegarde ou les ressources de reprise après sinistre-se trouvent dans des bâtiments séparés.

Interconnexion optique vs cuivre dans les centres de données désagrégés

Le choix entre l'optique et le cuivre n'est pas binaire - il dépend de la portée-. Voici comment les deux se comparent pour les facteurs les plus importants dans une conception désagrégée :

Facteur	Cuivre	Fibre Optique
Portée pratique à 800G	3 à 7 m (passif/actif)	100 m – 10+ km (selon le type d'optique)
Densité de bande passante	Inférieur par câble ; les câbles sont plus épais à des vitesses plus élevées	Plus élevé par câble ; la fibre fine prend en charge un nombre élevé de ports
Puissance par bit (portée plus longue)	Des - DSP, retimers et conditionnement du signal plus élevés sont requis	Abaisser à portée et vitesse équivalentes
Latence (courte portée)	Très faible (le cuivre passif n'a pas de surcharge de conversion)	Légèrement plus élevé en raison de la conversion électro-optique
Immunité aux EMI	Sensible aux interférences électromagnétiques	Immunité - importante dans les environnements denses à haute-puissance
Poids du câble et débit d'air	Plus lourd et plus volumineux à des comptes plus élevés	Plus léger et plus fin, meilleur pour la circulation de l'air dans les racks denses
Coût (courte portée, faible vitesse)	Baisser dès le départ	Plus élevé dès le départ
Coût (au niveau du système-, à grande échelle)	Peut être plus élevé en tenant compte des limites de puissance, de refroidissement et de portée	Coût total de possession souvent inférieur à 400 G+ et sur des trajets plus longs
Meilleur ajustement dans une conception désagrégée	Liens courts intra-plateau et intra-rack	Rack-à-rack, rangée-à-rangée, pièce-à-pièce et à l'échelle du campus-

Le point pratique : utilisez le cuivre là où la simplicité sur les courtes distances-l'emporte toujours. Utilisez l'optique là où la portée, la densité de bande passante, l'efficacité énergétique ou la gestion des câbles deviennent des contraintes majeures. Dans un environnement désagrégé, la part optique de l'interconnexion totale augmente car l'architecture elle-même crée des chemins de bande passante plus longs et plus élevés entre des pools de ressources séparés. Pour une comparaison plus approfondie des types de médias, voirCâbles fibre optique ou câbles cuivre : lequel convient à votre déploiement.

Copper versus optical interconnect comparison

Principaux avantages de l'interconnexion optique pour la désagrégation

Densité de bande passante plus élevée pour les pools de ressources séparés

La désagrégation augmente le volume de trafic traversant la couche d'interconnexion, car les ressources qui étaient autrefois colocalisées-communiquent désormais via la structure. La fibre optique répond à cette demande avec une bande passante par fibre-plus élevée et davantage de fibres par câble. Un seulcâble à fibres rubanpeut transporter des centaines de fibres dans une section transversale compacte-, permettant le type de densité de ports requis par les clusters GPU et les pools de mémoire désagrégés.

Réduction de la consommation d'énergie et de la charge thermique à grande échelle

L'efficacité énergétique est plus importante dans une conception désagrégée, car la couche d'interconnexion transporte une plus grande part du trafic total du système. À 800 G et plus, les liaisons en cuivre sur des distances modérées nécessitent un traitement DSP-énergivore aux deux extrémités. Les liaisons optiques à vitesses et distances équivalentes consomment moins d’énergie par bit. La documentation technique de NVIDIA sur sa plate-forme de commutation optique co--fait état d'unRéduction de 3,5 fois de la consommation d'énergiepar rapport aux émetteurs-récepteurs enfichables traditionnels. À l’échelle du centre de données, cette différence se traduit directement par des factures d’électricité inférieures et une infrastructure de refroidissement réduite.

Mise à l'échelle modulaire et indépendante

L’une des principales promesses de la désagrégation est que le calcul, la mémoire et le stockage peuvent évoluer à des rythmes différents. L'interconnexion optique tient cette promesse, car l'ajout de capacité à un pool de ressources ne nécessite pas de reconcevoir l'ensemble de la structure.Modules optiques enfichablespeut être mis à niveau ou ajouté progressivement - de 400G à 800G jusqu'à 1,6T - sans modifier l'usine de fibre sous-jacente.

Flexibilité pour des charges de travail hétérogènes

Lorsque les ressources sont regroupées et connectées via une structure optique-hautes performances, les équipes d'infrastructure peuvent attribuer des ressources aux charges de travail de manière dynamique au lieu de façonner les charges de travail autour de configurations de serveur fixes. Cette flexibilité est particulièrement précieuse dans les environnements où les tâches de formation d'IA,-l'inférence en temps réel, les pipelines d'analyse et les applications lourdes en stockage-coexistent et se font concurrence pour différents types de ressources.

Comment l'interconnexion optique est-elle liée aux systèmes optiques packagés CXL et Co ?

CXL : la couche protocolaire pour le partage de mémoire et de ressources

CXL (Compute Express Link) et l'interconnexion optique résolvent différentes parties du problème de désagrégation. CXL est un protocole standard ouvert - construit sur la couche physique PCIe - qui permet une communication cohérente du cache-entre les processeurs, les périphériques de mémoire et les accélérateurs. Il définit comment les ressources séparées peuvent être regroupées et partagées efficacement au niveau logiciel et protocole.

Le Consortium CXL, dont les membres incluent Intel, AMD, NVIDIA, Samsung, Microsoft, Google et Meta, a publié CXL 3.1 en novembre 2023 avec une prise en charge explicite decommutation multi-niveaux et désagrégation basée sur la structure-au-delà du support. CXL 3.0 a introduit la prise en charge de jusqu'à 4 096 nœuds dans une structure unifiée, permettant un pool de mémoire à l'échelle du rack-et potentiellement du cluster-à l'échelle du cluster.

L'interconnexion optique est le transport physique qui peut acheminer le trafic CXL (et d'autres protocoles) entre ces nœuds distribués. Une équipe évaluant le pool de mémoire basé sur CXL-et une équipe évaluant l'interconnexion optique travaillent souvent sur la même initiative de désagrégation sous des angles différents -l'un abordant la logique de protocole et de partage de ressources-, l'autre abordant le transport physique.

CXL over optical transport with co-packaged optics

Co-optiques packagées : rapprocher l'optique de la puce

L'optique co-packagée (CPO) va plus loin en intégrant des moteurs optiques directement sur le même substrat de boîtier que le commutateur ASIC ou le GPU, plutôt que de s'appuyer sur des émetteurs-récepteurs enfichables séparés connectés via des traces électriques sur un panneau avant. Cela élimine les chemins électriques les plus longs et les plus gourmands en énergie du système.

Lors du GTC 2025, NVIDIA a annoncé son premierplates-formes de commutation photoniques sur silicium co-packagées(Quantum-X Photonics et Spectrum-X Photonics), offrant jusqu'à 409,6 Tbit/s de bande passante avec 512 ports à 800 Gbit/s. Le PDG de NVIDIA, Jensen Huang, a noté que passer à un million de GPU à l'aide d'émetteurs-récepteurs enfichables conventionnels consommerait à lui seul environ 180 MW de puissance d'émetteur-récepteur -, un chiffre insoutenable auquel le CPO est conçu pour répondre.

Le CPO n’est pas quelque chose que toutes les équipes évaluant la désagrégation doivent déployer aujourd’hui. Les modules optiques enfichables restent le facteur de forme dominant pour la plupartfibre optique pour centre de donnéesdéploiements et se poursuivra au moins jusqu’à la fin des années 2020. Mais le CPO représente l'orientation de la feuille de route optique, et les équipes qui planifient de grands clusters d'IA ou des structures désagrégées de nouvelle-génération devraient suivre de près sa maturité.

Quand l’interconnexion optique est-elle la plus judicieuse ?

IA et accélérateurs-environnements lourds

Les clusters de formation en IA comptent parmi les cas d’utilisation les plus solides de l’interconnexion optique dans un contexte désagrégé. Ces systèmes génèrent un trafic massif est-ouest entre GPU-vers-GPU et GPU-vers-chemins de mémoire. À mesure que la taille des clusters passe de centaines à des milliers de GPU, les demandes en matière de portée et de bande passante dépassent rapidement ce que le cuivre peut prendre en charge. Dans l'architecture GB200 NVL72 de NVIDIA, par exemple, les coûts de mise en réseau (y compris les émetteurs-récepteurs optiques) représentent 15 à 18 % du coût total du cluster, et les émetteurs-récepteurs optiques représentent environ 60 % de ce coût de mise en réseau. Les arguments économiques et performants en faveur de l’optimisation de la couche optique sont substantiels.

Pool de mémoire et infrastructure composable

Si votre équipe évalue le pool de mémoire basé sur CXL-, la couche de transport physique doit prendre en charge cette séparation sans ajouter de latence inacceptable ni limiter l'évolutivité. CXL 3.1 cible explicitement la désagrégation à l'échelle de la structure au-delà du rack, ce qui signifie que les chemins d'interconnexion s'étendront sur des distances plus longues que les bus mémoire intra-serveurs traditionnels. Les liaisons optiques sont la solution naturelle pour ces chemins.

Environnements à grande-échelle avec des besoins d'évolutivité inégaux

L'interconnexion optique est également plus logique lorsque le calcul, la mémoire et le stockage doivent évoluer à des rythmes différents. Si votre capacité de calcul augmente de 3 fois par an mais que le stockage augmente de 1,5 fois, une architecture désagrégée vous permet d'étendre chaque pool indépendamment - et l'interconnexion optique rend cela physiquement possible sans repenser l'installation de câblage à chaque fois.

Quand ça n'a PAS de sens

L'interconnexion optique n'est pas le bon point de départ pour tous les environnements. Si votre centre de données exécute principalement des charges de travail-générales équilibrées sur des serveurs conventionnels et que votre trafic-de rack à-rack est modeste et bien-servi par l'infrastructure en cuivre existante, le coût et la complexité d'une structure optique-first peuvent ne pas être justifiés. De même, si vous travaillez à une échelle où quelques dizaines de serveurs répondent à vos besoins, la désagrégation elle-même peut introduire plus de complexité opérationnelle qu'elle n'en économise. L'architecture est payante lorsque l'échelle, l'hétérogénéité et le déséquilibre des ressources sont réels et mesurables - et non hypothétiques.

Que faut-il évaluer avant le déploiement

1. Cartographiez votre goulot d'étranglement réel

Commencez par une question claire : quelle est la contrainte contraignante ? Est-ce une portée (chemins de cuivre trop courts pour la disposition de votre rack) ? Densité de bande passante (pas assez de débit par câble pour alimenter votre cluster GPU) ? Alimentation (liaisons électriques consommant trop de puissance à 400G+) ? Utilisation des ressources (serveurs surprovisionnés sur un axe et affamés sur un autre) ? L’interconnexion optique est plus utile lorsque le goulot d’étranglement est physique et mesurable, et non lorsqu’elle est adoptée comme un geste général de modernisation.

2. Évaluez le coût total du système, et non le coût du câble

Une erreur courante consiste à comparer le prix d'un câble en cuivre au prix d'uncâble optiqueEn isolement. Cette comparaison est trompeuse. La comparaison significative inclut la consommation d'énergie, la surcharge thermique (et le coût de refroidissement qu'elle crée), la densité de ports par unité de rack, la portée utilisable, la flexibilité de mise à niveau et le coût des ressources bloquées dans l'architecture plus large. Dans de nombreux environnements désagrégés à 400G et plus, le coût total de possession de la fibre est inférieur à celui du cuivre lorsque l'on prend en compte l'ensemble du système.

3. Vérifiez la compatibilité et la disponibilité opérationnelle

Évaluertest de câbles à fibres optiquesexigences, l'interopérabilité des modules, les outils de surveillance et la familiarité opérationnelle de votre équipe avec la fibre. Les modules optiques enfichables (OSFP, QSFP-DD) sont bien-standardisés et largement pris en charge, mais votre équipe d'exploitation doit être à l'aise avec la manipulation, le nettoyage et le dépannage de la fibre avant de procéder à un déploiement à grande échelle. Envisagez de commencer par un domaine pilote où vous pourrez valider ces facteurs opérationnels.

4. Planifier la longévité de l'usine de fibre

L'un des avantages significatifs de l'infrastructure fibre est que l'installation fibre passive - les câbles, les panneaux de brassage et les chemins - peuvent prendre en charge plusieurs générations de technologie d'émetteur-récepteur. Un bien-conçuconnectivité du centre de donnéesL'usine de fibre optique installée aujourd'hui pour 400G peut prendre en charge les mises à niveau 800G et 1,6T en échangeant les émetteurs-récepteurs, sans tirer de nouveaux câbles. Cela rend l’investissement initial dans la fibre plus défendable sur un horizon de planification de 10 ans.

Un chemin d'adoption pratique

Étape 1 : Identifiez un domaine contraint.Recherchez l’endroit où la portée du cuivre, la puissance, la densité de bande passante ou le blocage des ressources créent déjà des difficultés mesurables. Il peut s'agir d'une extension de cluster GPU, d'un goulot d'étranglement de rack à-dans un environnement d'analyse ou d'un projet pilote de pool de mémoire.

Étape 2 : Piloter et valider.Déployez une interconnexion optique dans ce domaine. Mesurez le comportement de latence, la consommation d’énergie, la complexité opérationnelle et les économies d’expansion par rapport à votre référence existante.

Étape 3 : Développez en vous basant sur des preuves.Utilisez les données pilotes pour élaborer le dossier commercial et technique en vue d’une adoption plus large. La désagrégation et la migration optique sont rarement mieux gérées comme un seul projet big bang. Le déploiement progressif vous permet d’apprendre, de vous adapter et de renforcer la confiance organisationnelle.

Liste de contrôle décisionnelle : l'interconnexion optique est-elle adaptée à votre initiative de désagrégation ?

Les distances de liaison de votre rack-à-rack ou de pièce-à-dépassent-elles la portée pratique du cuivre à votre vitesse cible ?
Envisagez-vous de déployer des vitesses de liaison de 400 G ou plus à court terme ?
La consommation électrique provenant de l'interconnexion électrique devient-elle une part significative du budget énergétique de votre centre de données ?
Envisagez-vous d'évaluer le pool de mémoire basé sur CXL-, l'infrastructure composable ou l'extension de cluster GPU ?
Le blocage des ressources (calcul inactif, mémoire ou stockage verrouillé sur des serveurs fixes) est-il un problème de coût mesurable ?
Votre environnement doit-il faire évoluer le calcul, la mémoire et le stockage à des rythmes différents ?

Si trois de ces critères ou plus s'appliquent, l'interconnexion optique mérite une évaluation sérieuse dans le cadre de votre feuille de route de désagrégation.

FAQ

Qu’est-ce que l’interconnexion optique dans un data center ?

L'interconnexion optique est une technologie de transport qui utilise des signaux lumineux surcâbles à fibres optiquespour transporter des données entre les périphériques réseau, les serveurs, les commutateurs, les systèmes de stockage et les pools de ressources au sein et entre les centres de données. Il offre une bande passante plus élevée, une portée plus longue et une puissance par bit inférieure à celle du cuivre à des vitesses équivalentes -, ce qui le rend particulièrement important pour les architectures désagrégées et orientées IA-.

En quoi l’interconnexion optique diffère-t-elle du CXL ?

Ils opèrent à différents niveaux. L'interconnexion optique est une technologie de transport physique - qui déplace les bits d'un point A à un point B en utilisant la lumière. CXL est une norme de protocole qui définit la manière dont les processeurs, la mémoire et les accélérateurs communiquent de manière cohérente. L'interconnexion optique peut transporter le trafic CXL, mais CXL fonctionne également sur des liaisons électriques pour des connexions à courte portée-. Les équipes évaluent souvent les deux simultanément, car la désagrégation crée une demande à la fois pour de meilleurs protocoles (CXL) et un meilleur transport physique (optique).

Le cuivre et l’optique peuvent-ils coexister dans un data center désagrégé ?

Oui, et c’est généralement le cas. La plupart des environnements désagrégés utilisent le cuivre pour les connexions intra-rack très courtes (moins de 3 à 5 mètres) où cela reste plus simple et moins cher, et la fibre optique pour les racks-à-rack, de rangée-à-rangée et les chemins plus longs où les limitations de portée, de puissance et de densité du cuivre deviennent contraignantes. La décision dépend de la portée-, pas de tout-ou-de rien.

Qu'est-ce que les optiques co--packagées et en ai-je besoin maintenant ?

Les composants optiques co-packagés (CPO) intègrent des moteurs optiques directement dans le même boîtier que l'ASIC du commutateur ou le processeur, éliminant ainsi le besoin d'émetteurs-récepteurs enfichables séparés et réduisant la consommation d'énergie et la latence. NVIDIA et Broadcom déploient CPO sur les plates-formes réseau d'IA de nouvelle-génération. La plupart des centres de données n'ont pas besoin de CPO aujourd'hui -modules optiques enfichablesrestent la norme - mais le CPO est sur la feuille de route pour une infrastructure d'IA à grande échelle-sur la période 2026-2028.

Quand ne dois-je PAS procéder à la désagrégation avec une interconnexion optique ?

Si vos charges de travail sont bien-équilibrées entre le calcul, la mémoire et le stockage ; votre taille est modeste (quelques dizaines de serveurs) ; et votre infrastructure de cuivre existante gère sans contrainte vos besoins actuels et à court terme en bande passante - la complexité supplémentaire de la désagrégation et de la migration optique ne vaut peut-être pas l'investissement. Commencez par le goulot d’étranglement, pas par le mot à la mode.

Quels types de fibres sont utilisés dans l’interconnexion optique des centres de données ?

Fibre monomode-est utilisé pour les liaisons-distances plus longues et-vitesses plus élevées (généralement de rack-à-rack et au-delà).Fibre multimodeest courant pour les connexions intra-centre de données-plus courtes, jusqu'à quelques centaines de mètres. Le choix dépend de la portée requise, de la vitesse et du profil de coût de chaque lien.

Connaissance