Google выпускает сверхэффективную ИИ-модель Gemini 2.5 Flash

Компания Google представила новую ИИ-модель, разработанную для обеспечения высокой производительности с особым акцентом на эффективность. Модель Gemini 2.5 Flash скоро будет запущена на платформе Vertex AI — платформе Google для ИИ-разработки.

Компания заявляет, что она предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов. «Вы можете настраивать баланс между скоростью, точностью и стоимостью в соответствии с вашими конкретными потребностями», — сообщает Google.

Gemini 2.5 Flash появляется в момент, когда стоимость флагманских моделей ИИ продолжает расти. Более доступные по цене и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам, жертвуя при этом некоторой точностью.

Gemini 2.5 Flash является «рассуждающей» моделью, аналогичной o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для ответа на вопросы ей требуется немного больше времени, чтобы проверить собственные факты.

Google утверждает, что 2.5 Flash идеально подходит для «высокообъемных» и «работающих в реальном времени» приложений, таких как обслуживание клиентов и анализ документов.

«Эта рабочая модель специально оптимизирована для низкой задержки и сниженной стоимости», — говорится в сообщении Google. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов суммирования в реальном времени, где ключевую роль играет эффективность в масштабе».

Google не опубликовала отчет о безопасности или технический отчет для Gemini 2.5 Flash, что затрудняет понимание того, в чем модель преуспевает и где у нее есть недостатки.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.