Компания VK официально представила обновленную версию своей языковой модели Diona, обученной в том числе на пользовательском контенте из социальной сети “ВКонтакте”. Об этом сообщает “Коммерсантъ” со ссылкой на заявление компании.
Впервые о том, что VK обучает нейросеть на комментариях из “ВКонтакте”, стало известно в феврале 2024 года. Теперь компания не только выпустила обновленную версию модели, но и раскрыла ее название — Diona. Помимо комментариев из социальной сети, для базового обучения модели использовались “большие объемы текстов”, однако конкретные источники не уточняются.
По сравнению с предыдущей версией, количество параметров Diona увеличилось в 1,5 раза и теперь составляет от 4 до 30 миллиардов. При этом обновленная модель требует меньше вычислительных ресурсов для работы, что повышает ее эффективность.
VK не раскрывает объем инвестиций в разработку и обучение нейросети. По оценке источника “Коммерсанта” в крупной российской ИТ-компании, затраты могли составить от 500 до 800 миллионов рублей. Однако опрошенные изданием эксперты полагают, что реальные затраты были значительно выше.
Важная особенность Diona заключается в том, что пользователи не могут получить прямой доступ к модели — она интегрирована в различные продукты экосистемы VK. В настоящее время функции генеративного искусственного интеллекта на базе Diona доступны в сервисах Mail (“Почта”, “Календарь”, “Заметки”), а также в “VK Рекламе”, RuStore, образовательной платформе “Учи.ру” и других продуктах компании.
Эксперты отмечают, что создание собственной языковой модели позволяет VK снизить зависимость от сторонних решений и лучше адаптировать возможности генеративного ИИ под специфику своих сервисов. Использование пользовательского контента из “ВКонтакте” для обучения модели потенциально повышает ее способность понимать особенности русскоязычного интернет-общения и современный сленг.
По мнению аналитиков рынка, разработка Diona является частью стратегии VK по усилению технологической самостоятельности в условиях растущей конкуренции на рынке искусственного интеллекта. В перспективе возможности модели могут быть расширены для поддержки большего количества продуктов экосистемы VK и потенциального использования в новых сервисах компании.