Nvidia анонсировала новую инфраструктуру и ИИ-модели на конференции NeurIPS в Сан-Диего. Компания работает над технологиями для физического ИИ, включая роботов и автономные машины.
Производитель полупроводников представил Alpamayo-R1. Это открытая визуальная языковая модель с функцией рассуждения для исследований автономного вождения. Компания заявляет, что это первая модель такого типа для беспилотного транспорта.
Узнать подробнее про клуб ShareAI
Визуальные языковые модели обрабатывают текст и изображения одновременно. Это позволяет машинам видеть окружающую обстановку и принимать решения на основе восприятия.
Новая модель основана на Cosmos-Reason от Nvidia. Это модель рассуждения, которая обдумывает решения перед ответом. Nvidia выпустила семейство Cosmos в январе 2025 года. Дополнительные модели появились в августе.
Технология вроде Alpamayo-R1 критически важна для достижения четвертого уровня автономного вождения. Это означает полную автономность в определенной зоне и при конкретных обстоятельствах.
Nvidia надеется, что модели рассуждения дадут автономным машинам здравый смысл. Это поможет лучше подходить к сложным решениям при вождении, как это делают люди.
Новая модель доступна на GitHub и Hugging Face. Разработчики могут свободно использовать ее для проектов.
Наряду с моделью Nvidia загрузила на GitHub пошаговые руководства, ресурсы для инференса и рабочие процессы постобучения. Все это вместе называется Cosmos Cookbook. Материалы помогут разработчикам обучать модели Cosmos под конкретные задачи.
Руководство охватывает курирование данных, генерацию синтетических данных и оценку моделей.
Анонсы происходят в момент, когда компания активно продвигает физический ИИ как новое направление для своих GPU.
Соучредитель и глава Nvidia Дженсен Хуанг неоднократно заявлял, что следующая волна ИИ будет физической. Билл Далли, главный научный сотрудник Nvidia, поддержал это мнение летом в беседе с TechCrunch.
«Я думаю, что роботы будут играть огромную роль в мире, и мы хотим создавать мозги для всех роботов», — сказал Далли. «Для этого нам нужно разрабатывать ключевые технологии уже сейчас».

