Google представил Gemini 2.5 Flash Preview – гибридную модель, которая может самостоятельно определять глубину необходимых размышлений. Новая модель сохранила скорость работы и доступную цену Flash 2.0, но теперь демонстрирует значительно более продуманные и качественные ответы.
Тесты на платформе LMArena с использованием сложных запросов показали, что Gemini 2.5 Flash уверенно превосходит такие мощные модели как Claude Sonnet 3.5, Sonnet 3.7 и Claude R1 от Anthropic. А через API можно вручную устанавливать лимит от 0 до 24 576 токенов, чем выше лимит, тем интеллектуальнее становятся ответы.
По производительности новинка находится на уровне o4-mini от OpenAI и Grok-3 от xAI, однако предлагается пользователям по существенно более низкой цене. Тарифы действительно впечатляют – всего $0.15 за миллион токенов на входе и $0.6 за миллион токенов на выходе. Даже при использовании полного режима размышлений стоимость составляет около $3.5 за миллион токенов, что выгодно выделяет модель на фоне конкурентов.
В текущем ландшафте ИИ-решений ситуация складывается не в пользу Claude – модели Sonnet 3.7 и R1 уже заметно отстают по качеству от новинки Google. В то же время, хотя Grok-3 и o4-mini демонстрируют незначительное преимущество в сложных задачах, по соотношению цены и качества Gemini 2.5 Flash становится явным лидером рынка.
Примечательно, что Google обеспечил широкую доступность новой модели – её уже можно протестировать через Google AI Studio, Vertex AI, Gemini API, а также в приложении Gemini через меню выбора моделей.