Технологический гигант Tencent представил комплекс интересных ИИ-инструментов, способных преобразовывать текст и изображения в трехмерную графику. Это 5 моделей с открытым исходным кодом на базе технологии Hunyuan3D-2.0, включая так называемые «турбо» версии, которые, по заявлению разработчиков, способны создавать 3D-визуализации всего за 30 секунд, сохраняя при этом высокую точность и качество.
Инициатива Tencent в области 3D следует за февральским запуском Hunyuan Turbo S – языковой модели, которая, по утверждению компании, обрабатывает запросы быстрее, чем флагманская модель DeepSeek R1.
Узнать подробнее про клуб ShareAI
Этот запуск происходит на фоне того, как китайские компании, особенно стартап DeepSeek, начинают активно конкурировать с доминированием США в области ИИ, предлагая сопоставимую или превосходящую производительность при значительно меньших затратах.
Впервые представив свои 3D ИИ-модели в ноябре 2024 года, Tencent ориентировалась прежде всего на дизайнеров и разработчиков игр, стремясь занять лидирующие позиции в области технологий преобразования текста и изображений в трехмерные модели. В январе компания запустила Hunyuan3D-2.0, заявив о превосходстве над ведущими отраслевыми моделями по показателям текстовой согласованности, геометрической точности и качества визуализации.
Примечательно, что ByteDance, материнская компания TikTok, также активно развивает направление преобразования текста и изображений в 3D со своей моделью VeOmniverse, выпущенной в 2024 году. Однако, в отличие от открытого подхода Tencent, их разработка остается закрытой проприетарной технологией.