Технологический гигант Tencent представил комплекс интересных ИИ-инструментов, способных преобразовывать текст и изображения в трехмерную графику. Это 5 моделей с открытым исходным кодом на базе технологии Hunyuan3D-2.0, включая так называемые «турбо» версии, которые, по заявлению разработчиков, способны создавать 3D-визуализации всего за 30 секунд, сохраняя при этом высокую точность и качество.
Инициатива Tencent в области 3D следует за февральским запуском Hunyuan Turbo S – языковой модели, которая, по утверждению компании, обрабатывает запросы быстрее, чем флагманская модель DeepSeek R1.
Этот запуск происходит на фоне того, как китайские компании, особенно стартап DeepSeek, начинают активно конкурировать с доминированием США в области ИИ, предлагая сопоставимую или превосходящую производительность при значительно меньших затратах.
Впервые представив свои 3D ИИ-модели в ноябре 2024 года, Tencent ориентировалась прежде всего на дизайнеров и разработчиков игр, стремясь занять лидирующие позиции в области технологий преобразования текста и изображений в трехмерные модели. В январе компания запустила Hunyuan3D-2.0, заявив о превосходстве над ведущими отраслевыми моделями по показателям текстовой согласованности, геометрической точности и качества визуализации.
Примечательно, что ByteDance, материнская компания TikTok, также активно развивает направление преобразования текста и изображений в 3D со своей моделью VeOmniverse, выпущенной в 2024 году. Однако, в отличие от открытого подхода Tencent, их разработка остается закрытой проприетарной технологией.