Cohere выпустила открытые модели для 70 языков

Cohere выпустила открытые модели для 70 языков

Компания Cohere запустила новое семейство мультиязычных моделей Tiny Aya. Анонс состоялся на полях India AI Summit. Это открытые модели с публичным кодом для использования и изменения.

Модели поддерживают больше 70 языков. Они могут работать на обычных устройствах вроде ноутбуков без подключения к интернету. Система поддерживает языки Южной Азии - бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи.

Базовая модель содержит 3,35 миллиарда параметров. Cohere выпустила TinyAya-Global для приложений с широкой языковой поддержкой. Эта версия лучше следует командам пользователя.

Семейство включает региональные варианты. TinyAya-Earth для африканских языков, TinyAya-Fire для языков Южной Азии, TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.

Каждая модель развивает сильную языковую основу и культурные нюансы. При этом все модели сохраняют широкое мультиязычное покрытие. Это делает их гибкими для адаптации и исследований.

Модели тренировались на кластере из 64 GPU H100 от Nvidia. Использовались относительно скромные ресурсы. Это делает их доступными для исследователей и разработчиков.

Модели могут работать прямо на устройствах. Разработчики используют их для офлайн-перевода. Программное обеспечение требует меньше вычислительной мощности, чем у большинства похожих моделей.

В странах вроде Индии такая возможность открывает широкий набор применений без постоянного доступа к интернету.

Модели доступны на HuggingFace и Cohere Platform. Разработчики могут скачать их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания выпускает наборы данных для обучения на HuggingFace.

Глава Cohere Эйдан Гомес заявил в прошлом году, что компания планирует выйти на IPO скоро. По данным CNBC, компания закончила 2025 год с годовой выручкой 240 миллионов долларов. Рост составлял 50 процентов от квартала к кварталу в течение года.

Анна Маркова
Анна Маркова

Специализируется на технологической журналистике с фокусом на искусственный интеллект. Пишет о реальном применении ИИ в бизнесе и повседневной жизни.