Design Arena получила анонимную модель похожую на Grok

Design Arena запустила тестирование модели Obsidian без указания разработчика. Платформа специализируется на слепом сравнении AI. Пользователи оценивают качество без знания бренда.

Стиль ответов и структура кода Obsidian совпадают с семейством Grok. Илон Маск анонсировал Grok 4.20 на конец 2025 — начало 2026 года. Совпадение по времени указывает на связь.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Доступ к модели ограничен форматом платформы. Пользователь отправляет запрос и получает результаты от случайных моделей. Obsidian появляется среди соперников непредсказуемо. Может потребоваться несколько попыток.

Тестировщики фиксируют интересный паттерн. Новая версия генерирует значительно больше кода на идентичные задачи. Предыдущие Grok 4 и Grok 4.1 были лаконичнее. Изменение философии разработки очевидно.

Увеличение объема кода имеет последствия. С одной стороны — детальность и читаемость решений. С другой — рост потребления токенов и времени выполнения. Компромисс между качеством и эффективностью.

Результаты показывают прогресс в веб-разработке внутри линейки Grok. Но абсолютное отставание сохраняется. Claude Opus 4.5 и Gemini 3 Pro удерживают лидерство. Разрыв заметен даже без знания брендов моделей.

Слепое тестирование исключает предвзятость. Пользователи не знают, какую модель оценивают. Отставание Obsidian от лидеров подтверждается объективно. Это не вопрос репутации разработчика.

Маск позиционирует Grok 4.20 как завершение текущего цикла. Компания уже тренирует Grok 5. Обещания амбициозные — самая большая модель xAI в истории.

Мультимодальность нового поколения выходит за рамки текста и изображений. Заявлена возможность понимания интерфейсов программ в реальном времени. Также игр и других динамических систем. Релиз запланирован на первый квартал 2026 года.

Если прогноз сбудется, между Grok 4.20 и Grok 5 пройдет минимум времени. Возможно несколько месяцев. Это короткий промежуток для двух крупных релизов.

Стратегия тестирования через Design Arena показательна. xAI получает честную обратную связь от сообщества разработчиков. Без влияния имени Маска и хайпа вокруг компании.

Obsidian демонстрирует позицию xAI на рынке. Компания улучшает продукт, но не догоняет Anthropic и Google. Разрыв в качестве веб-разработки существенный. Прорыв может принести только Grok 5.

Увеличение кода при той же задаче требует объяснения. Либо модель стала менее эффективной. Либо изменились приоритеты — детальность важнее краткости. Второй вариант вероятнее для финальной версии линейки.

Автор: Анна Маркова
Специализируется на технологической журналистике с фокусом на искусственный интеллект. Пишет о реальном применении ИИ в бизнесе и повседневной жизни.