Компания Google представила новую ИИ-модель, разработанную для обеспечения высокой производительности с особым акцентом на эффективность. Модель Gemini 2.5 Flash скоро будет запущена на платформе Vertex AI — платформе Google для ИИ-разработки.
Компания заявляет, что она предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов. «Вы можете настраивать баланс между скоростью, точностью и стоимостью в соответствии с вашими конкретными потребностями», — сообщает Google.
Gemini 2.5 Flash появляется в момент, когда стоимость флагманских моделей ИИ продолжает расти. Более доступные по цене и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам, жертвуя при этом некоторой точностью.
Gemini 2.5 Flash является «рассуждающей» моделью, аналогичной o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для ответа на вопросы ей требуется немного больше времени, чтобы проверить собственные факты.
Google утверждает, что 2.5 Flash идеально подходит для «высокообъемных» и «работающих в реальном времени» приложений, таких как обслуживание клиентов и анализ документов.
«Эта рабочая модель специально оптимизирована для низкой задержки и сниженной стоимости», — говорится в сообщении Google. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов суммирования в реальном времени, где ключевую роль играет эффективность в масштабе».
Google не опубликовала отчет о безопасности или технический отчет для Gemini 2.5 Flash, что затрудняет понимание того, в чем модель преуспевает и где у нее есть недостатки.