Будет создан ИИ нового поколения, способный вести эмоциональные разговоры с людьми. Под это видение стартап WaveForms AI, получил финансирование в размере $40 млн от венчурной фирмы Andreessen Horowitz при оценке компании в $200 млн.
Алексис Конно, генеральный директор и сооснователь WaveForms AI, ранее участвовал в создании голосового режима для модели GPT-4o от OpenAI. Именно эта разработка произвела фурор в индустрии, продемонстрировав возможность вести разговор в реальном времени без задержек и даже поддерживать естественные прерывания — характеристики, которые до сих пор считались недостижимыми для ИИ-ассистентов.
Кстати, после выпуска GPT-4o произошёл любопытный инцидент: глава OpenAI Сэм Альтман опубликовал в соцсети X загадочное слово «her», очевидно намекая на фильм Спайка Джонза 2013 года, где главный герой влюбляется в ИИ-ассистента с голосом Скарлетт Йоханссон. Интересно, что позже актриса обвинила OpenAI в копировании её голоса, хотя компания настаивала на использовании голоса другой актрисы.
Вместе с соосновательницей Корали Леметр, Конно планирует использовать привлечённые средства для обучения новых аудио-ИИ моделей. Их главная цель — сделать общение с ИИ неотличимым от разговора с человеком. «Аудио передаёт эмоции и обеспечивает эмоциональный отклик пользователям», — подчеркивает Конно.
WaveForms AI намерена создать потребительский программный продукт, фокусирующийся на эмоциональной связи между пользователем и ИИ. «Мы стремимся создать новый, более иммерсивный опыт взаимодействия с ИИ, который будет по-настоящему приятным», — поясняет Конно.
«Сейчас многие компании сосредоточены на создании суперинтеллекта, но мало кто уделяет внимание качеству взаимодействия между человеком и компьютером».