На конференции GTC Nvidia показала дорожную карту дата-центров до 2028 года. Ключевые сюрпризы — GPU Feynman с die stacking, собственный CPU Rosa и переход NVLink на оптику.
2027: Rubin Ultra и 144 GPU в одной стойке
В следующем году выйдут ускорители Rubin Ultra с четырьмя вычислительными чиплетами и 1 ТБ памяти HBM4E. К ним добавится LPU Groq LP35 с поддержкой формата NVFP4. Стойка Kyber NVL144 упакует 144 GPU-пакета и обеспечит в четыре раза большую производительность против нынешней Oberon NVL72 с 72 GPU Blackwell.
2028: качественный скачок по всем фронтам
GPU Feynman получат die stacking — технологию трёхмерного объединения чипов, которая открывает новый путь масштабирования производительности. Вместе с кастомной памятью (вероятно, вариант C-HBM4E) ёмкость HBM превысит 1 ТБ на пакет.
Параллельно Nvidia выпустит CPU Rosa (сокращение от Rosalyn) — собственный процессор с акцентом на одноядерную производительность. Цикл разработки CPU сократился с четырёх лет до двух: компания вышла на темп AMD и Intel.
LPU LP40 поддержит NVFP4 и впервые подключится к остальным компонентам через NVLink — Groq-железо становится частью экосистемы Nvidia на уровне протокола.
Главное изменение в интерконнектах — коммутаторы NVLink с co-packaged optics (CPO). Оптика в NVLink позволит масштабировать стойки до 576 GPU (шасси Oberon) или 1152 GPU (шасси Kyber). Сейчас оптика технически возможна, но CPO делает её существенно дешевле и проще в реализации.
Закрывает картину 2028 года BlueField-5 DPU, 7-е поколение Ethernet-решений SpectrumX с CPO и SuperNIC ConnectX 10.
Nvidia обновляет архитектуру GPU раз в два года и выпускает новые AI-ускорители ежегодно. Feynman — это следующий шаг после Rubin, а не косметическое обновление.