현재 램 부족 사태의 가장 큰 원흉
# 베라 루빈 NVL72 상세 요약
- CPU: Vera CPU 36개 (88코어 Arm 기반 Olympus 커스텀 코어, LPDDR5X 메모리 최대 1.5TB 지원)
- GPU: Rubin GPU 72개 (HBM4 메모리 탑재, GPU당 288GB, Transformer Engine 지원)
- 슈퍼칩 단위: Vera CPU 1개 + Rubin GPU 2개 결합
- 기타 칩: NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet 스위치 등 6개 칩 극한 공동 설계
## 성능 (Blackwell 대비)
- 추론(Inference): 5배 향상 (NVFP4 기준 3.6 EFLOPS, GPU당 50 PFLOPS)
- 훈련(Training): 3.5배 향상 (NVFP4 기준 2.5 EFLOPS)
- 토큰당 비용: MoE 모델 기준 10분의 1 수준 (추론 비용 대폭 절감)
- MoE 모델 훈련: 필요한 GPU 수 4분의 1로 감소
- 메모리: HBM4 20.7TB + LPDDR5X 54TB
- 대역폭: NVLink 6로 GPU당 3.6 TB/s, 랙 전체 260 TB/s (인터넷 전체 대역폭 초과)
램을 몇층씩 적층으로 쌓은 HBM4를 '테라'단위로 씀.
시스템 구조라 1GPU당은 288GB,
이런데 램이 안 부족하면 그게 더 신기할 지경임







