Nvidia представила новый GPU для обработки больших контекстов

Компания Nvidia анонсировала новый графический процессор Rubin CPX, специально созданный для работы с контекстными окнами более миллиона токенов. Презентация состоялась во вторник на саммите AI Infrastructure Summit.

Rubin CPX входит в новую серию продуктов Nvidia и оптимизирован для обработки больших последовательностей контекста. Устройство будет частью более широкого подхода к инфраструктуре, который компания называет «разделенным выводом» (disaggregated inference). Для пользователей это означает лучшую производительность при работе с задачами, требующими длинного контекста, такими как генерация видео или разработка программного обеспечения.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Постоянный цикл разработки новых продуктов принес Nvidia огромную прибыль. В последнем квартале доход компании от продаж решений для дата-центров составил 41,1 миллиарда долларов.

По планам Nvidia, графический процессор Rubin CPX появится на рынке в конце 2026 года.

Новый GPU станет важным дополнением к линейке продуктов компании, ориентированных на рынок искусственного интеллекта. Способность обрабатывать более миллиона токенов открывает новые возможности для создания более сложных и продвинутых ИИ-систем.

Этот анонс подтверждает лидерство Nvidia на рынке аппаратного обеспечения для искусственного интеллекта. Компания продолжает выпускать специализированные решения, отвечающие растущим требованиям разработчиков ИИ.

Технология «разделенного вывода», частью которой является Rubin CPX, направлена на оптимизацию работы с большими объемами данных. Это особенно важно для таких областей, как генерация видео, где требуется обработка значительного количества информации.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.