Компания Cohere запустила новое семейство мультиязычных моделей Tiny Aya. Анонс состоялся на полях India AI Summit. Это открытые модели с публичным кодом для использования и изменения.
Модели поддерживают больше 70 языков. Они могут работать на обычных устройствах вроде ноутбуков без подключения к интернету. Система поддерживает языки Южной Азии — бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи.
Узнать подробнее про клуб ShareAI
Базовая модель содержит 3,35 миллиарда параметров. Cohere выпустила TinyAya-Global для приложений с широкой языковой поддержкой. Эта версия лучше следует командам пользователя.
Семейство включает региональные варианты. TinyAya-Earth для африканских языков, TinyAya-Fire для языков Южной Азии, TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.
Каждая модель развивает сильную языковую основу и культурные нюансы. При этом все модели сохраняют широкое мультиязычное покрытие. Это делает их гибкими для адаптации и исследований.
Модели тренировались на кластере из 64 GPU H100 от Nvidia. Использовались относительно скромные ресурсы. Это делает их доступными для исследователей и разработчиков.
Модели могут работать прямо на устройствах. Разработчики используют их для офлайн-перевода. Программное обеспечение требует меньше вычислительной мощности, чем у большинства похожих моделей.
В странах вроде Индии такая возможность открывает широкий набор применений без постоянного доступа к интернету.
Модели доступны на HuggingFace и Cohere Platform. Разработчики могут скачать их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания выпускает наборы данных для обучения на HuggingFace.
Глава Cohere Эйдан Гомес заявил в прошлом году, что компания планирует выйти на IPO скоро. По данным CNBC, компания закончила 2025 год с годовой выручкой 240 миллионов долларов. Рост составлял 50 процентов от квартала к кварталу в течение года.

