Яндекс предоставил метод дообучения нейросетей LoRA

Yandex B2B Tech предоставил клиентам метод дообучения нейросетей LoRA (Low-Rank Adaptation). Который позволяет бизнесу самостоятельно и быстро адаптировать искусственный интеллект под свои специфические задачи. При этом стоимость использования дообученных моделей останется на уровне базовых версий.

Технология уже доступна на платформе AI Studio и работает с нейросетью YandexGPT и опенсорсной моделью LLaMA. В ближайшее время компания планирует расширить список поддерживаемых моделей, включив Qwen и DeepSeek, которые можно будет запускать на выделенных мощностях по запросу. Это позволит компаниям использовать несколько дообученных нейросетей одновременно, комбинируя их для различных сценариев.

Ключевое преимущество технологии — впечатляющая скорость работы. При обработке небольших датасетов весь процесс дообучения занимает всего 10 минут благодаря тому, что алгоритм изменяет минимальное количество параметров, ориентируясь на эталонные запросы и ответы из пользовательского датасета.

Эффективность метода уже подтверждена практикой: более 100 клиентов протестировали LoRA для различных бизнес-задач, включая разработку Telegram-ботов для ритейла, классификацию запросов в поддержку и генерацию рекламного контента. Особенно показателен опыт компании Presentsimple.ai, которая использует дообученную версию YandexGPT 4 Lite для автоматической генерации презентаций. Результат впечатляет: стоимость генерации снизилась в шесть раз, а время создания серии объемных слайдов сократилось до 30-40 секунд.

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – подчеркнул Григорий Атрепьев, CPO Yandex Cloud.

После кастомизации нейросети демонстрируют значительно более высокое качество в решении специфических задач: они лучше суммаризируют и точнее классифицируют тексты, строже следуют заданному формату ответа и успешнее придерживаются определенной роли в диалоге. Примечательно, что даже облегченные версии моделей после дообучения могут превосходить по качеству ответов более мощные базовые версии нейросетей.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.