

# Infraestrutura NVIDIA GB200 NVL72 e Cablagem MPO-8 APC para Unidades Escaláveis

A Unidade Escalável (SU) DGX GB200 representa uma grande mudança na arquitetura de data center. A SU é uma entidade unificada de 576 GPUs interconectadas por 9.216 fios de fibra ativa. A ScaleFibre fornece os troncos terminados com precisão necessários para gerenciar essa densidade.


---


## As 4 Redes Físicas do SuperPOD
A NVIDIA segmenta a SU em camadas físicas distintas para isolar o tráfego da GPU.

### MN-NVL (NVLink 5) [Scale-Up]

* A rede interna do rack conectando 72 GPUs a 1,8 TB/s.
**Features:**
  - Zero Fibra Óptica
  - Backplane Passivo de Cobre
  - Conectores Blind-mate

### InfiniBand de Computação [Scale-Out]

* A principal rede 'East-West' para treinamento massivo multi-nó.
**Features:**
  - 4.608 fibras ativas por SU
  - Topologia otimizada para trilhos
  - Quantum-3/Quantum-2

### Armazenamento e In-Band [Frontend]

* Rede baseada em Ethernet para ingestão e provisionamento de dados de alta velocidade.
**Features:**
  - Fator de Bloqueio 5:3
  - Descarregamento de DPU BlueField-3
  - Suporte VXLAN/RoCE

### Gerenciamento OOB [Plano de Controle]

* A rede isolada para telemetria de hardware, BMC e gerenciamento de PDU.
**Features:**
  - Cobre RJ45/Cat6
  - Nível de Switch SN2201
  - Segurança física de air-gap


## Métricas SU Exascale
Uma Unidade Escalável (SU) de 8 racks representa o bloco de construção fundamental da NVIDIA AI Factory.

| Metric | Value |
| :--- | :--- |
| Fibras Ativas por SU | **9,216** |
| Fios Somente de Computação | **4,608** |
| Proporção de Bloqueio de Armazenamento | **5:3** |
| Velocidades de Porta Nativas | **400G/800G** |
## Os Três Níveis de Conectividade SU
1. **Nível A: Servidor para Leaf**: 1.152 fibras por rack usando troncos ou jumpers de alta contagem de fibras para conectar nós NVL72 a Leaf Switches.
2. **Nível B: Leaf para Spine**: Agregando tráfego alinhado a trilhos dentro da SU usando links não bloqueantes 1:1 para computação.
3. **Nível C: Spine para Core**: Dimensionamento além da SU para uma área Core centralizada usando troncos de alta contagem.

## Comparison: Patching Legado (Ponto-a-Ponto) vs. Troncos Modulares de Alta Contagem de Fibras

### Patching Legado (Ponto-a-Ponto)
* Complexidade Manual: Requer 9.216 patch cords individuais por bloco de 8 racks.
* Obstrução do Fluxo de Ar: Feixes densos de cabos bloqueiam os caminhos de exaustão de refrigeração líquida.
* Perfil de Risco: Alta probabilidade de 'trilhos cruzados' durante o patching manual 1:1.
* Tempo de Implantação: Mais de 115 horas para roteamento e rotulagem manuais por SU.

### Troncos Modulares de Alta Contagem de Fibras
* Plug-and-Play: Consolida milhares de fibras em troncos pré-terminados adaptados de 128F/144F/256F/288F/576F.
* Otimização Térmica: Cabos de pequeno diâmetro maximizam o fluxo de ar em racks densos.
* Eficiência de Caminho: Consolida 1.152 fibras ativas por rack em backbones MPO de alta contagem.
* Perfil de Instalação: Implantação rápida através de conjuntos pré-terminados e testados em fábrica.

## Expert Insight
> ""
> — **<no value>**, <no value>
## Technical FAQ
**Q: Como a contagem da SU se mantém gerenciável em 9.216 fibras?**
A: Usando uma hierarquia de cablagem em camadas. [Troncos de alta contagem de fibras](/products/optical-cable-assemblies/mpo-trunks/high-fibre-count-mpo-trunks/) substituem milhares de patch cords MPO individuais, reduzindo o volume físico e prevenindo obstruções de resfriamento.

**Q: O que é o 'Fator de Bloqueio 5:3' na rede de armazenamento?**
A: Ao contrário da rede de computação não bloqueante (1:1), a rede de armazenamento é intencionalmente superprovisionada. Isso reduz custos e complexidade de fibra, ao mesmo tempo em que atende ao requisito de 40GB/s por nó para armazenamento. A implantação frequentemente utiliza [cabos patch MPO compatíveis com NVIDIA](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-patch-cable-apc/).

**Q: Por que a rede NVLink interna não tem fibras?**
A: A NVIDIA utiliza um backplane passivo de cobre e cartuchos de cabo dentro do rack NVL72. Isso elimina milhares de transceptores e fibras ópticas, reduzindo significativamente o consumo de energia e a latência. A fibra óptica é reservada para a [rede de computação scale-out](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-splitter-ndr/).

**Q: O que acontece quando escalamos para 16 Unidades Escaláveis?**
A: Na escala de 16 SUs (9.216 GPUs), a contagem total de fibras ativas apenas para a rede de computação atinge 18.432 fios. Gerenciar essa densidade requer [caixas de alta densidade](/products/housings/high-fibre-count-housings/highstack-fixed-housings-for-high-count-optical-fibre/) projetadas especificamente para fibras ópticas de alta contagem e arquiteturas de comutação de grupo de núcleo centralizado.

**Q: Por que MPO-8 é usado em vez do MPO-12 padrão?**
A: Os transceptores modernos 400G NDR e 800G XDR usam ópticas paralelas de 4 ou 8 pistas. Um alinhamento MPO de 8 fibras corresponde perfeitamente à configuração 4x Tx e 4x Rx. Usar [troncos MPO ativos de 8 fibras](/products/optical-cable-assemblies/mpo-trunks/small-fibre-count-mpo-trunks/) elimina fibras 'escuras' ou desperdiçadas dentro da rede do cluster.

**Q: Qual a importância do polimento APC (Angled Physical Contact)?**
A: A sinalização 100G-PAM4 de alta velocidade é extremamente sensível a reflexões. O ângulo de 8 graus de um [conector APC](/products/optical-cable-assemblies/mpo-trunks/nvidia-compatible-mpo-patch-cable-apc/) garante que a luz refletida seja absorvida no revestimento da fibra, mantendo a alta Perda de Retorno Óptico (ORL) necessária para o treinamento de IA sem erros.

**Q: Como a densidade da fibra afeta os centros de dados refrigerados a líquido para IA?**
A: Mesmo com bandejas refrigeradas a líquido, o ar ainda precisa circular para gerenciar o calor secundário. Usar [cabos SmartRibbon de alta densidade](/products/fibre-optic-cables/indoor-cables/smartribbon-flame-retardant-optical-fibre-cables/) reduz significativamente o diâmetro do cabo, garantindo que a cablagem física não obstrua o fluxo de ar ou os coletores de refrigeração líquida.

**Q: Quais são as limitações de distância para cablagem em nível de SU?**
A: Multimodo (OM4/OM5) é restrito a 50 metros para 400G/800G. Para links Spine-to-Core centralizados que excedem isso, a [fibra Monomodo G.657.A1](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/slimcore-144-fibre-indoor-fibre-optic-cable/) é obrigatória para suportar alcances maiores sem degradação do sinal.

**Q: Posso usar cabos externos padrão para backbones de data center de IA?**
A: Não. As salas internas de IA exigem [LSZH (Low Smoke Zero Halogen)](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/), Riser ou Plenum para atender aos regulamentos de segurança contra incêndio exigidos, dependendo das regulamentações locais. Para caminhos de alta densidade, [cabos internos SlimCORE especializados](/products/fibre-optic-cables/indoor-cables/slimcore-indoor-optical-cables/slimcore-288-fibre-indoor-fibre-optic-cable/) fornecem a contagem de fios necessária em um diâmetro reduzido.

**Q: Qual é o benefício de pigtails terminados em fábrica na SU?**
A: [Pigtails de fibra óptica com cabo MPO](https://americas.scalefibre.com/en/products/optical-cable-assemblies/optical-fibre-pigtails/mpo-cord-optical-fibre-pigtails/) permitem a emenda de fusão em massa rápida na camada Spine ou Core. Essa terminação controlada em fábrica em uma extremidade oferece os benefícios da pré-terminação, enquanto a extremidade 'bruta' permite flexibilidade para encaixe no comprimento necessário no local.


## References

