ElevenLabs выпустила обновление ElevenAgents с режимом Expressive Mode

ElevenLabs выпустила крупное обновление платформы ElevenAgents. Новый режим Expressive Mode позволяет ботам динамически управлять интонацией и эмоциональной окраской речи.

Агент теперь может адаптироваться под собеседника в реальном времени. Говорить мягче и спокойнее в напряженной ситуации. Или добавить уверенности и темпа, когда нужно донести информацию максимально ясно.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Апдейт базируется на двух компонентах. Первый — новая TTS-модель Eleven v3 Conversational, оптимизированная для диалогов. Она удерживает контекст беседы и избегает характерного роботизированного звучания.

Второй компонент — переработанная система смены очереди говорящего. Используя данные транскрибации, ИИ теперь точнее определяет уместные моменты для вступления в разговор и пауз.

Это решает давнюю проблему голосовых ботов, которые часто перебивают на полуслове. Поддержка нового режима заявлена для более 70 языков.

Динамическое управление интонацией кардинально меняет взаимодействие с голосовыми агентами. Раньше боты говорили монотонно вне зависимости от ситуации. Теперь они реагируют на эмоциональное состояние собеседника.

Модель Eleven v3 Conversational специально создана для разговоров. В отличие от предыдущих версий, заточенных на зачитывание текста, новая версия понимает диалоговый контекст. Это позволяет поддерживать естественный ритм беседы.

Переработанная система смены очереди анализирует паузы и интонации. ИИ различает завершенную мысль и короткую паузу для размышления. Так бот избегает неуместных вступлений в разговор.

Поддержка более 70 языков делает обновление глобальным. Пользователи из разных стран смогут общаться с адаптивными голосовыми агентами на родном языке.

Способность говорить мягче в напряженных ситуациях полезна для поддержки клиентов. Бот может распознать раздраженного собеседника и скорректировать тон для деэскалации конфликта.

Уверенная и быстрая речь помогает при передаче важной информации. Бот определяет, когда нужна четкость, и автоматически меняет темп и интонацию.

Устранение роботизированного звучания повышает доверие к голосовым агентам. Люди легче воспринимают информацию от естественно звучащего собеседника.

Решение проблемы перебиваний критично для пользовательского опыта. Боты, которые постоянно прерывают, вызывают раздражение и снижают эффективность коммуникации.

Автор: Анна Маркова
Специализируется на технологической журналистике с фокусом на искусственный интеллект. Пишет о реальном применении ИИ в бизнесе и повседневной жизни.