Google объявила о запуске новой функции в системе искусственного интеллекта Gemini, позволяющей создавать персонализированные иллюстрированные книги для детей с аудиосопровождением. Нововведение работает на основе текстовых запросов пользователя и поддерживает 45 языков, включая русский.
Функционал системы позволяет генерировать истории практически на любую тему. Пользователи могут запросить создание образовательного рассказа, например, об устройстве Солнечной системы, или истории с воспитательным подтекстом о важности доброго отношения к младшим.
Узнать подробнее про клуб ShareAI
Особенностью технологии является возможность использовать в качестве основы для сюжета не только текстовые описания, но и визуальные материалы — фотографии, изображения и детские рисунки.
Процесс создания книги, по данным Google, занимает всего несколько минут. После генерации контента система предоставляет пользователю интерфейс в стиле Canvas с двумя основными элементами: в правой части экрана отображается созданная книга, а в левой находится чат для взаимодействия с искусственным интеллектом.
Для оформления доступны различные стили, включая пиксельную графику, комиксы, пластилиновую анимацию, орнаментальные мотивы и формат раскраски.
Итоговый продукт представляет собой десятистраничную книгу с иллюстрациями и звуковым сопровождением.
Технология позволяет настраивать тональность аудио, выбирая более высокий или низкий голос для озвучивания. Пользователи могут поделиться результатом через ссылку или загрузить файл для последующей печати на бумажном носителе.