Стартап Physical Intelligence из Сан-Франциско опубликовал исследование с неожиданным результатом: их новая модель π0.7 направила роботов выполнять задачи, на которых их никто специально не тренировал.
До сих пор роботов обучали по-старому: собери данные под конкретную задачу, натренируй модель, повтори для следующей задачи. π0.7 работает иначе — она комбинирует знания из разных контекстов и применяет их в новых ситуациях. Исследователи называют это «композиционным обобщением».
Главная демонстрация — аэрофритюрница. В обучающей выборке нашлось только два эпизода с этим прибором: в одном робот просто закрыл крышку, в другом — положил внутрь бутылку. Без дополнительных инструкций модель сделала слабую попытку приготовить сладкий картофель. Когда исследователи объяснили роботу задачу шаг за шагом — как объясняют новому сотруднику — успех вырос с 5% до 95%.
Сергей Левин, сооснователь Physical Intelligence и профессор Беркли в области AI для робототехники, говорит, что способности модели растут быстрее, чем подсказывает объём обучающих данных. Это то же явление, что наблюдали с языковыми моделями.
Один из исследователей, Ашвин Балакришна, признался: «Я купил случайный набор шестерёнок и спросил робота: можешь вращать вот эту? Он просто взял и сделал. Меня это реально удивило.» По его словам, за несколько лет работы с данными это первый раз, когда он не смог предсказать, что модель умеет.
Важный нюанс: π0.7 пока не справляется с многошаговыми задачами по одной общей команде. «Скажи ей “приготовь тост” — не получится. Но если объяснять каждый шаг — работает», — говорит Левин.
Модель сравнивали не с внешними бенчмарками (их в робототехнике почти нет), а с собственными узкоспециализированными моделями компании. Результат сопоставимый — при приготовлении кофе, складывании белья и сборке коробок.
Physical Intelligence привлекла более $1 млрд инвестиций и оценивается в $5,6 млрд. Сейчас компания обсуждает новый раунд, который может довести оценку до $11 млрд. Сроки коммерческого запуска продуктов на основе π0.7 компания не называет.