Новый Grok 3 от Маска стал лидером среди языковых моделей

Компания xAI представила новую языковую модель Grok 3, которая превзошла ведущих конкурентов, включая OpenAI GPT-4, Claude 3.5, Deepseek V3 и Gemini 2 Pro по множеству показателей. Модель продемонстрировала впечатляющие результаты в различных тестах: 96% в математических задачах AIME с использованием режима рассуждений, 85% в научном тесте GPQA и 80% в программировании по методике LiveCodeBench.

Особенно значимым достижением стал рекордный показатель в 1400 баллов ELO на платформе LMArena, что вывело Grok 3 на первое место среди всех существующих моделей. Илон Маск, возглавляющий xAI, подчеркнул, что новая версия использует в 10 раз больше вычислительной мощности по сравнению с Grok 2.

Система работает на суперкомпьютере Colossus, оснащенном 100 000 графических процессоров NVIDIA H100. По словам Маска, модель достигла “пугающе умного” уровня интеллекта.

Среди уникальных возможностей Grok 3 – способность создавать оригинальные игры без опоры на существующие аналоги, что, по мнению разработчиков, знаменует начало эры “творческого мышления” в ИИ. Модель также получила режим “Big Brain” для расширенных вычислений и рассуждений.

В ближайшее время xAI планирует запустить веб-версию сервиса с несколькими ИИ-персонажами для разных пользовательских предпочтений, а также интегрировать голосовые функции. Компания также объявила о планах сделать исходный код Grok 2 открытым в течение нескольких месяцев.