Вышла модель Holo2 для работы с интерфейсами приложений

Представили Holo2. Это мультимодальная модель нового поколения для работы с интерфейсами. Она умеет понимать их структуру, находить нужные элементы и делать выводы. Модель работает в веб-пространстве, на компьютерах и мобильных устройствах.

Holo2 показала хорошие результаты в тестах. На бенчмарке ScreenSpot-Pro она достигла 66,1%. На OSWorld-G результат составил 76,1%. Это на 3-5% выше, чем у предыдущих версий. Модель превосходит все существующие аналоги.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Основа Holo2 — архитектура Qwen3-VL. Она дает модели глубокое понимание интерфейсов. Навигация стала лучше по сравнению с прошлыми версиями. Модель получила способность рассуждать. Этого не хватало предыдущим решениям.

Holo2 одинаково хорошо работает в разных средах. Она поддерживает браузер, Ubuntu и Android. Это делает её удобной для интеграции в разные платформы и системы.

Флагманская версия называется 30B-A3B. Она использует технологию Mixture of Experts. На каждом шаге работы активируется только 3 млрд параметров. При этом качество остается на уровне модели с 30 млрд параметров. Вычислительная стоимость при этом значительно меньше.

Модель самостоятельно генерирует reasoning-токены. Это специальные токены для процесса рассуждения. Они повышают точность работы и устойчивость к контексту.

Holo2 полностью совместима с архитектурой Surfer 2. Также она работает с ReAct-пайплайнами. Это делает её подходящей для создания продвинутых UI-агентов. Такие агенты могут выполнять сложные задачи в интерфейсах.

Развернуть Holo2 можно несколькими способами. Модель работает напрямую через vLLM. Также подходит любой фреймворк, совместимый с Qwen3-VL.

У модели есть три версии с разными лицензиями. Версии 4B и 8B доступны под лицензией Apache-2. Это позволяет использовать их в коммерческих проектах. Версия 30B-A3B предназначена только для некоммерческого использования.

Выход Holo2 расширяет возможности ИИ в работе с пользовательскими интерфейсами. Модель может помочь автоматизировать задачи, требующие понимания структуры приложений и веб-страниц.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.