NVIDIA и Google Cloud объявили о расширении партнёрства: компании запускают новые серверные инстансы A5X на базе NVIDIA Vera Rubin NVL72 — стоечной системы корпоративного уровня.
Важная деталь: A5X — это bare-metal инстансы. Не виртуальные серверы, а физические машины, которые одна компания использует целиком, без соседей по железу.
По сравнению с предыдущим поколением A5X даёт в 10 раз меньше затрат на генерацию одного токена и в 10 раз выше пропускную способность на мегаватт потребляемой мощности.
Масштаб впечатляет: связка NVIDIA ConnectX-9 SuperNIC и сетевой системы Google Virgo позволяет объединить до 80 тысяч GPU Rubin в рамках одного дата-центра, а при мультисайтовой конфигурации — до 960 тысяч GPU.
В экосистему также войдут: предварительный просмотр Google Gemini на Google Distributed Cloud поверх GPU Blackwell и Blackwell Ultra, конфиденциальные виртуальные машины с Blackwell, а также агентный ИИ на платформе Gemini Enterprise Agent Platform с открытыми моделями NVIDIA Nemotron и фреймворком NeMo.
Всё это заточено под тяжёлые задачи: мультимодальный инференс, обработку данных, сложные симуляции для физического ИИ и робототехники.
Партнёрство NVIDIA и Google отмечает десятилетний юбилей — A5X становится его самым масштабным результатом.