Компания VK официально представила обновленную версию своей языковой модели Diona, обученной в том числе на пользовательском контенте из социальной сети «ВКонтакте». Об этом сообщает «Коммерсантъ» со ссылкой на заявление компании.
Впервые о том, что VK обучает нейросеть на комментариях из «ВКонтакте», стало известно в феврале 2024 года. Теперь компания не только выпустила обновленную версию модели, но и раскрыла ее название — Diona. Помимо комментариев из социальной сети, для базового обучения модели использовались «большие объемы текстов», однако конкретные источники не уточняются.
Узнать подробнее про клуб ShareAI
По сравнению с предыдущей версией, количество параметров Diona увеличилось в 1,5 раза и теперь составляет от 4 до 30 миллиардов. При этом обновленная модель требует меньше вычислительных ресурсов для работы, что повышает ее эффективность.
VK не раскрывает объем инвестиций в разработку и обучение нейросети. По оценке источника «Коммерсанта» в крупной российской ИТ-компании, затраты могли составить от 500 до 800 миллионов рублей. Однако опрошенные изданием эксперты полагают, что реальные затраты были значительно выше.
Важная особенность Diona заключается в том, что пользователи не могут получить прямой доступ к модели — она интегрирована в различные продукты экосистемы VK. В настоящее время функции генеративного искусственного интеллекта на базе Diona доступны в сервисах Mail («Почта», «Календарь», «Заметки»), а также в «VK Рекламе», RuStore, образовательной платформе «Учи.ру» и других продуктах компании.
Эксперты отмечают, что создание собственной языковой модели позволяет VK снизить зависимость от сторонних решений и лучше адаптировать возможности генеративного ИИ под специфику своих сервисов. Использование пользовательского контента из «ВКонтакте» для обучения модели потенциально повышает ее способность понимать особенности русскоязычного интернет-общения и современный сленг.
По мнению аналитиков рынка, разработка Diona является частью стратегии VK по усилению технологической самостоятельности в условиях растущей конкуренции на рынке искусственного интеллекта. В перспективе возможности модели могут быть расширены для поддержки большего количества продуктов экосистемы VK и потенциального использования в новых сервисах компании.

