Google Gemma 4: агентный ИИ прямо на телефоне, без облака и без слежки

Google Gemma 4: агентный ИИ прямо на телефоне, без облака и без слежки

Google выпустила Gemma 4 — открытую модель, которая работает полностью на устройстве. Никаких серверов, никакой передачи данных. Текст, изображения, голос — всё обрабатывается локально.

Модель выходит в четырёх вариантах. Два из них — E2B и E4B — созданы специально для смартфонов. E2B занимает 1,3 ГБ памяти и работает на телефонах с 6 ГБ ОЗУ, E4B нужно 2,5 ГБ и минимум 8 ГБ ОЗУ. Два других варианта — 26B и 31B — для серверов и мощного железа.

Главная новинка — «агентные навыки». Модель умеет самостоятельно обращаться к инструментам: искать в Википедии, открывать карты, строить сводки и карточки для запоминания. При этом интернет нужен только самим инструментам — сама модель работает офлайн, а история чатов нигде не сохраняется.

Google совместно с Arm и Qualcomm оптимизировала модель под современные мобильные чипы. На Android Gemma 4 работает в четыре раза быстрее предыдущего поколения и потребляет на 60% меньше заряда. На чипах Arm с инструкцией SME2 прирост ещё больше — в среднем 5,5 раза.

Запустить модель можно через бесплатное приложение Google AI Edge Gallery, доступное на Android 12 и iOS 17. После выхода оно взлетело на четвёртое место в топе бесплатных приложений для продуктивности в App Store — сразу после Claude, Gemini и ChatGPT.

Лицензия Apache 2.0 означает, что разработчики могут использовать модель в коммерческих продуктах без ограничений. Семейство Gemma в целом набрало уже более 400 миллионов загрузок.

Gemma 4 станет основой для следующего Gemini Nano 4 — новой системной модели Android. Уже сейчас Gemini Nano работает более чем на 140 миллионах устройств. Код, написанный под Gemma 4 сегодня, будет работать с Gemini Nano 4 без изменений.

Юлия Самойлова
Юлия Самойлова

Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.