Компания Google представила новую ИИ-модель, разработанную для обеспечения высокой производительности с особым акцентом на эффективность. Модель Gemini 2.5 Flash скоро будет запущена на платформе Vertex AI — платформе Google для ИИ-разработки.
Компания заявляет, что она предлагает “динамические и контролируемые” вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов. “Вы можете настраивать баланс между скоростью, точностью и стоимостью в соответствии с вашими конкретными потребностями”, — сообщает Google.
Gemini 2.5 Flash появляется в момент, когда стоимость флагманских моделей ИИ продолжает расти. Более доступные по цене и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам, жертвуя при этом некоторой точностью.
Gemini 2.5 Flash является “рассуждающей” моделью, аналогичной o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для ответа на вопросы ей требуется немного больше времени, чтобы проверить собственные факты.
Google утверждает, что 2.5 Flash идеально подходит для “высокообъемных” и “работающих в реальном времени” приложений, таких как обслуживание клиентов и анализ документов.
“Эта рабочая модель специально оптимизирована для низкой задержки и сниженной стоимости”, — говорится в сообщении Google. “Это идеальный движок для отзывчивых виртуальных помощников и инструментов суммирования в реальном времени, где ключевую роль играет эффективность в масштабе”.
Google не опубликовала отчет о безопасности или технический отчет для Gemini 2.5 Flash, что затрудняет понимание того, в чем модель преуспевает и где у нее есть недостатки.