Сбер представил модель GigaChat 2.0, она обошла GPT-4, DeepSeek-V3 и LLaMA 70B

Сбер официально представил обновленную нейросетевую модель GigaChat 2.0, которая не просто стала лидером среди отечественных разработок. Но и уверенно обошла мировых гигантов, включая GPT-4, DeepSeek-V3 и LLaMA 70B, согласно авторитетному бенчмарку MERA, который специализируется на оценке языковых моделей. GigaChat 2.0 заняла первое место среди всех ИИ-моделей на русском языке.

Среди ключевых преимуществ новой версии GigaChat 2.0 — колоссальное увеличение объема обрабатываемого контекста. Если предыдущие модели могли анализировать только 48 страниц текста за один запрос, то теперь этот показатель вырос до впечатляющих 200 страниц. При этом точность ответов на вопросы увеличилась на 25%, а способность следовать инструкциям пользователя улучшилась вдвое.

Новая линейка GigaChat 2.0 представлена тремя различными моделями, каждая из которых ориентирована на решение определённых задач.

Флагманская модель GigaChat 2 MAX — улучшенные возможности в точных науках, кодировании и фактологических вопросах. Для бизнеса с умеренными техническими ресурсами разработана GigaChat 2 Pro, которая, несмотря на меньшую требовательность к оборудованию, сохраняет высочайшее качество выполнения задач.

А базовая модель GigaChat 2 Lite предназначена для решения стандартных задач с минимальными затратами.

Особо следует отметить революционную поддержку ИИ-агентов, благодаря которой можно создавать полностью автономных помощников, способных решать сложнейшие многокомпонентные задачи. Технические специалисты оценят совместимость с популярным SDK LangChain, что открывает широкие возможности для разработки ИИ-агентов на языках Python и JavaScript.

Комментируя это технологическое достижение, старший вице-президент и руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев подчеркнул, что GigaChat 2.0 — это не просто улучшение метрик и технических характеристик, а настоящий прорыв в развитии русскоязычных больших языковых моделей (LLM).

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.