Руководитель платформы AI Studio в Yandex B2B Tech Артур Самигуллин — о конкуренции с иностранными моделями и как Яндекс продает свои и опенсорсные нейросети

Артур, расскажи, чем занимаешься в Яндексе? 

Я работаю в Yandex Cloud, отвечаю за AI Studio и весь продуктовый ML-портфель. Если просто — мы предоставляем внешним компаниям доступ к ML-технологиям Яндекса. Мы строим платформу, на которой можно собрать и запустить ИИ-приложения или агентов – как через SDK, так и с помощью low-code инструментов. Под капотом будут генеративки Яндекса или опенсорсные модели, наш поиск и инференс.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

То есть ты токены продаешь? 

В том числе, генеративные модели и агентские решения поверх них – наша большая ставка сейчас. Но продуктовый портфель шире — есть сервисы для распознавания и синтеза речи, для аналитики диалогов в контакт-центрах, инструменты корпоративного поиска, хаб для внешних MCP-серверов, готовые ИИ-агенты. Таких решений наберется с десяток.

При этом фокус с речевых и поисковых направлений никуда не уходит. Скорее появляется тренд на мультиагентные системы, которые смогут использовать все эти инструменты, чтобы выполнить задачу пользователя – от планирования отдыха до анализа конкурентов. 

Глобально наша идея в том, чтобы у каждого сотрудника любой компании был ИИ-помощник, который возьмет на себя часть рутины. Для этого можно использовать готовые решения, можно написать своего ИИ-агента на опенсорсных фреймворках, можно собрать его вообще без написания кода и встроить в него нужные инструменты вроде веб-поиска. Все эти сценарии подходят как для стартапов, так и для корпораций, и все их можно реализовать на нашей платформе.

Если говорить именно о токенах, то у меня два противоположных вопроса. Для начала – а зачем вы развиваете свою модель YandexGPT? Вы ведь сами на платформе продаете доступ к Qwen, DeepSeek и другим опенсорсным моделям, значит признаете спрос на них. 

Модели YandexGPT самые популярные в нашем парке моделей, в первую очередь клиенты приходят в Yandex Cloud именно за ними. Мы видим, что наша нейросеть лучше работает в RAG-сценариях, в саммаризации и извлечении данных из текста, особенно на русском языке. В то же время клиенты используют Qwen3 235B, например, для запуска ИИ-агентов или генерации кода, среди опенсорсных ее используют чаще других.

При этом инвестиции в собственные технологии – это не выбор, они для нас обязательны. Мы повышает качество моделей в конкретных бизнес-сценариях наших клиентов, чтобы они могли стабильно использовать нейросети в своих процессах. На практике этот процесс приближает нас к повсеместному внедрению ИИ в бизнесе. Условный Qwen, когда выпускает новую модель, никак не ориентируется на наших клиентов и не оптимизирует под них свои решения.

И обещанный противоположный вопрос. В чем добавленная стоимость Яндекса при потреблении опенсорсных моделей? Почему клиент покупает Qwen у вас, а не у другого поставщика? 

Чтобы запустить Qwen-235B самостоятельно, нужно довольно много вычислительных мощностей,  далеко не у всех они есть. К тому же, модели нужно тюнить под конкретные задачи, обеспечить защиту данных и многое другое. И все это — только для запуска одной модели, которая теоретически может и не подойти для вашего бизнеса.

Поэтому мы даем рынку комплексную платформу, на которой в том числе предлагаем безопасный и оптимизированный инференс. Так его стоимость будет через ниже, чем при самостоятельном развертывании. Благодаря постепенному снижению внутренней стоимости инференса каждая следующая модель Яндекса в облаке дешевле предыдущей.

Кроме самих мощностей, на которых уже развернуты генеративные модели, мы также предлагаем инструменты для адаптации модели под конкретные задачи бизнеса – в том числе корпоративный поиск, realtime-сценарии для голосовых агентов и т.д. При этом в облаке можно потестить разные модели и выбрать нужную.

У нас один из самых больших парков нейросетей – как текстовых вроде Qwen3 235B, так и визуально-генеративных моделей, например Gemma 27B VL. Есть и специализированные модели эмбеддеров, рефразеров и токенизаторов. Если клиенту нужна какая-то экзотика, мы можем по запросу развернуть модель в dedicated-режиме на выделенных мощностях. В России поставщиков Qwen-235B сейчас два, включая нас. В мире — скорее десятки. 

Не проигрышная ли позиция продавать токены? Завтра клиент может поменять YandexGPT на DeepSeek и ваше облако на чужое.

Сами по себе нейросети уже не являются для бизнеса чем-то уникальным, и зарабатывать на одних лишь «голых» моделях практически невозможно. Опенсорс делает базовую технологию доступной для всех, но сами модели могут обеспечить только 70% качества при решении бизнес-задач. Для коммерческого внедрения качество должно быть не менее 90%. Эту разница можно добрать с помощью инструментов – например, для подключения приложений к внешним системам по MCP.

Поэтому сейчас конкуренция идет не на уровне моделей, а на уровне конечных продуктов и платформ для разработки ИИ-приложений. Мы строим нашу платформу, чтобы дать рынку инструменты, которые одинаково нужны и стартапам, и корпорациям.

Таким образом мы пытаемся добавить ценность на каждом этапе разработки приложений. Если клиент собрал агента в нашей платформе, загрузил векторное хранилище, построил корпоративный поиск с учетом сложного контекста — миграция станет гораздо более трудозатратной. 

С одной стороны, вы говорите о B2B-клиентах с корпоративными задачами, с другой — о продаже токенов. Логично, что корпорации должны покупать готовые решения, а не голые модели. 

AI Studio — платформа для разработчиков, но внедрение ИИ в компаниях идет, как правило, от бизнес-команд. Они ставят стратегическую цель автоматизировать процессы в компании или создать пилотный проект в каком-нибудь департаменте. Поэтому важно, чтобы на нашей платформе можно было собрать ИИ-решения, даже если у нет для этого выделенного штата разработчиков и ML-инженеров.

Поэтому мы идем двумя путями. С одной стороны, мы создаем среду для end-to-end разработки ИИ-приложений, где мы закрываем основные инженерные сложности при создании таких решений — от обеспечения качества и безопасности до внедрения low-code-инструментов. Это снижает порог входа для использования ИИ – фактически любая компания сможет силами 1-2 разработчиков создать уникальное решение уровня Яндекса.

С другой стороны, мы создаем готовые конечные решения, которые закрывают наиболее распространенные клиентские задачи. Например, Нейросаппорт поможет операторам поддержки быстро найти ответ на вопрос пользователя, Нейроюрист ответит на вопросы по юридическим документам, а Нейроаналитик найдет инсайты на дашбордах.

Получается, вы конкурируете со своими клиентами-разработчиками? 

Мы скорее показываем рынку пример того, что они могут собрать на нашей платформе. Во многом мы видим своей целью создание этого рынка — как через инструменты для разработчиков, так и через готовые продукты, которые создают спрос и показывают возможности нейросетей. В случае с Нейроюристом мы как раз создаем спрос на такие решения. При этом на нашей платформе уже есть несколько внешних команд, которые создают своих агентов для юридической сферы.

Куда сейчас движется рынок с точки зрения ИИ?

Главный тренд ИИ-рынка сейчас – это развитие агентов и мультиагентских систем. В отличие от ИИ-ассистентов, они могут самостоятельно понять, как решить ту или иную задачу, и могут использовать различные инструменты для ее выполнения. Для этого они могут взаимодействовать с внешними системами – например, запрашивать данные в базах данных, планировать отдых для пользователя и так далее.

Но построить хорошего агента — это большая работа с набором знаний в конкретной области. Например, даже когда ищешь условные билеты в Шерегеш, агенту нужно знать, что там нет аэропорта, и предложить варианты в соседних городах. Собрать всю эту экспертизу все же необходимо человеку.

В будущем роль многих профессий сильно изменится – специалисты будут меньше делать руками, и больше – управлять мультиагентными системами, которые выполняют большую часть их задач. При этом сами специалисты будут чаще брать на себя принятие ответственных управленческих решений, которые будет трудно делегировать нейросетям.

Что сейчас мешает активному внедрению ИИ?

Базовое качество самих моделей пока не позволяет легко реализовать большинство сценариев. Но это не мешает технологическим компаниям и разработчикам создавать агентов уже сегодня – понимая, что в перспективе их возможности станут еще больше. Например, сегодня агенты, собранные на нашей платформе, уже могут оценить комплаенс-риски для работы с клиентами. Для этого они могут анализировать публичные документы о компании и запросить информацию по MCP-протоколу в “Контур.Фокусе”.

В целом активному внедрению ИИ также мешает километровый путь от прототипа до продакшна. Неравнодушный разработчик собирает прототип, показывает менеджменту, получает одобрение. Но дальше нужен стабильный и быстрый инференс, который будет сходиться по экономике, нужно тюнить под конкретные задачи бизнеса, строить интеграции. В результате внедрение оказывается очень сложным, и не все проходят этот путь до конца.

Решение лежит в тулинге — инструментах для создания приложений. Многое есть в опенсорсе, но компании приходят к нам за платформенными сервисами ради скорости разработки. Поэтому чем активнее клиенты используют платформы вроде нашей, тем выше их шансы довести ИИ до прода.

Когда большинство российских компаний сможет использовать ИИ для рутины?

Ожидать массового внедрения ИИ в бизнес-процессах стоит уже в ближайшие 2-3 года. Сегодняшний этап внедрения ИИ можно сравнить с началом 2000-х годов — тогда компьютерные системы и приложения уже постепенно появлялись, но многие процессы по-прежнему были ручными. И уже очень быстро наличие почты, онлайн-календаря и CRM-систем стало нормой. При этом проникновение ИИ будет происходить быстрее, чем ПО.

Сейчас вопрос внедрения зависит не столько от технологии, сколько от готовности самих компаний. Мы видим, как они постепенно переходят от тестирования пилотов к полноценной интеграции ИИ, особенно в автоматизации документооборота и при анализе данных. Это также сильно зависит от индустрии – в том же ритейле и банках уже давно внедряют ИИ, в то время как в промышленности этот процесс сильно медленнее.

При этом любопытно, что сотрудники многих компаний часто используют нейросети в личной жизни. Они наверняка оживляли фотографию в Алисе, искали что-нибудь в Perplexity, генерировали песни в Suno. Но когда они приходят на работу, таких инструментов там попросту нет.

Поэтому чтобы ускорить внедрение ИИ в бизнес-процессы, стоит дать работникам хотя бы простой доступ к LLM-моделям или простым агентам. В таком случае у них появится привычка использовать нейросети не только в личной, но и рабочей жизни, и они будут готовы применять более сложные решения.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.