Робот научился делать то, чему его не учили

Стартап Physical Intelligence из Сан-Франциско опубликовал исследование с неожиданным результатом: их новая модель π0.7 направила роботов выполнять задачи, на которых их никто специально не тренировал.

До сих пор роботов обучали по-старому: собери данные под конкретную задачу, натренируй модель, повтори для следующей задачи. π0.7 работает иначе — она комбинирует знания из разных контекстов и применяет их в новых ситуациях. Исследователи называют это «композиционным обобщением».

Главная демонстрация — аэрофритюрница. В обучающей выборке нашлось только два эпизода с этим прибором: в одном робот просто закрыл крышку, в другом — положил внутрь бутылку. Без дополнительных инструкций модель сделала слабую попытку приготовить сладкий картофель. Когда исследователи объяснили роботу задачу шаг за шагом — как объясняют новому сотруднику — успех вырос с 5% до 95%.

Сергей Левин, сооснователь Physical Intelligence и профессор Беркли в области AI для робототехники, говорит, что способности модели растут быстрее, чем подсказывает объём обучающих данных. Это то же явление, что наблюдали с языковыми моделями.

Один из исследователей, Ашвин Балакришна, признался: «Я купил случайный набор шестерёнок и спросил робота: можешь вращать вот эту? Он просто взял и сделал. Меня это реально удивило.» По его словам, за несколько лет работы с данными это первый раз, когда он не смог предсказать, что модель умеет.

Важный нюанс: π0.7 пока не справляется с многошаговыми задачами по одной общей команде. «Скажи ей “приготовь тост” — не получится. Но если объяснять каждый шаг — работает», — говорит Левин.

Модель сравнивали не с внешними бенчмарками (их в робототехнике почти нет), а с собственными узкоспециализированными моделями компании. Результат сопоставимый — при приготовлении кофе, складывании белья и сборке коробок.

Physical Intelligence привлекла более $1 млрд инвестиций и оценивается в $5,6 млрд. Сейчас компания обсуждает новый раунд, который может довести оценку до $11 млрд. Сроки коммерческого запуска продуктов на основе π0.7 компания не называет.