ИИ-бот Gemini научился озвучивать тексты в Google Документах

Компания Google добавила в сервис Google Документы новую функцию преобразования текста в речь на основе ИИ-модели Gemini. Теперь пользователи могут прослушивать свои документы в аудиоформате вместо чтения.

Функция «Аудио» размещена в меню «Инструменты» в верхней части интерфейса Google Документов. После нажатия кнопки «Прослушать эту вкладку» на экране появляется небольшой проигрыватель с указанием длительности созданного аудиофайла.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Проигрыватель можно перемещать по экрану и настраивать скорость воспроизведения и интонацию голоса.

Пользователи также могут добавлять звуковые кнопки в любом месте документа для последующего прослушивания отдельных фрагментов. Это может быть полезно тем, кто лучше воспринимает информацию на слух.

Пока функция работает только с английским языком и доступна в веб-версии Google Документов. Воспользоваться новой возможностью смогут подписчики Google AI Pro и Ultra, а также корпоративные клиенты компании.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.