Компания xAI представила новую языковую модель Grok 3, которая превзошла ведущих конкурентов, включая OpenAI GPT-4, Claude 3.5, Deepseek V3 и Gemini 2 Pro по множеству показателей. Модель продемонстрировала впечатляющие результаты в различных тестах: 96% в математических задачах AIME с использованием режима рассуждений, 85% в научном тесте GPQA и 80% в программировании по методике LiveCodeBench.
Особенно значимым достижением стал рекордный показатель в 1400 баллов ELO на платформе LMArena, что вывело Grok 3 на первое место среди всех существующих моделей. Илон Маск, возглавляющий xAI, подчеркнул, что новая версия использует в 10 раз больше вычислительной мощности по сравнению с Grok 2.
Узнать подробнее про клуб ShareAI
Система работает на суперкомпьютере Colossus, оснащенном 100 000 графических процессоров NVIDIA H100. По словам Маска, модель достигла «пугающе умного» уровня интеллекта.
Среди уникальных возможностей Grok 3 – способность создавать оригинальные игры без опоры на существующие аналоги, что, по мнению разработчиков, знаменует начало эры «творческого мышления» в ИИ. Модель также получила режим «Big Brain» для расширенных вычислений и рассуждений.
В ближайшее время xAI планирует запустить веб-версию сервиса с несколькими ИИ-персонажами для разных пользовательских предпочтений, а также интегрировать голосовые функции. Компания также объявила о планах сделать исходный код Grok 2 открытым в течение нескольких месяцев.