UBS выпустил аналитический отчет о сделке между Nvidia и стартапом Groq. Швейцарский банк оценивает стоимость соглашения в $20 миллиардов. Это не покупка компании. Nvidia платит за лицензию на технологию и ключевых специалистов.
Аналитики интерпретируют сделку как признание фундаментальной проблемы. GPU плохо справляются с инференсом — запуском уже обученных моделей. Этот сегмент растет быстрее других на рынке AI-ускорителей.
Узнать подробнее про клуб ShareAI
Корень проблемы в архитектуре HBM. Высокопропускная память расположена за пределами чипа. Каждое обращение к ней создает задержку. При генерации токенов каждая миллисекунда критична.
GPU создавались для обучения нейросетей. Там приоритет — пропускная способность. Можно пожертвовать латентностью ради объема обработанных данных. Инференс работает наоборот. Важна скорость отклика, а не объем.
Groq построила LPU на принципиально другой основе. Language Processing Unit использует SRAM-память внутри чипа. Это дает пропускную способность 80 ТБ/с против 8 ТБ/с у HBM. Десятикратное преимущество.
Результат — латентность падает на порядок. Время выполнения операций становится предсказуемым. Для коммерческих систем это критический фактор.
UBS провел опрос крупных облачных провайдеров за последний год. Технологию Groq упоминали чаще других стартапов-разработчиков ускорителей. Рынок уже оценил преимущества встроенной памяти.
Структура сделки нестандартная. Nvidia получила неэксклюзивную лицензию. Забрала основателя Джонатана Росса и президента Санни Мадру с командой инженеров. Но Groq остается независимой компанией.
Новый CEO Саймон Эдвардс возглавит стартап. GroqCloud продолжит обслуживать клиентов. Nvidia не поглощает бизнес — только берет технологию и людей.
$20 миллиардов за лицензионное соглашение — беспрецедентная сумма. Обычно такие деньги платят за полное поглощение успешной компании. Это показывает серьезность намерений Nvidia.
Банк связывает сделку с общим стратегическим поворотом. Nvidia анонсировала Rubin CPX — специализированный ускоритель для инференса. Компания признала необходимость ASIC-подобных решений вместо универсальных GPU.
Доминирование Nvidia в обучении моделей бесспорно. Но рынок инференса развивается по другим правилам. Там побеждают специализированные архитектуры с минимальной латентностью.
Сделка отправляет сигнал всей индустрии. Даже лидер рынка признает ограничения своей флагманской технологии. GPU останутся для тренировки. Но запуск моделей потребует новых решений.
Конкуренты получили подтверждение правильности альтернативных подходов. Рынок AI-ускорителей не монополизирован. Есть пространство для инноваций в архитектуре чипов.

