Компания Generalist выпустила ИИ-модель GEN-1, которая управляет роботами при выполнении сложных задач, требующих человеческой ловкости. Главный результат: там, где прежние системы справлялись в 64% случаев, GEN-1 доводит показатель до 99%.
Робот под управлением GEN-1 сложил футболку 86 раз подряд без единого сбоя, проверил робот-пылесос более 200 раз, упаковал блочные игрушки свыше 1800 раз и сложил картонные коробки более 200 раз подряд. Если кто-то мешал роботу в процессе, тот просто начинал заново — без остановки и без ошибок.
GEN-1 — мультимодальная модель, которая выдаёт команды в реальном времени. Это развитие предыдущей модели GEN-0, и разница существенная: GEN-1 выполняет задачи примерно в три раза быстрее и лучше справляется с непредвиденными ситуациями.
Ключевая особенность подхода — данные для обучения. Большинство робототехнических моделей опираются на огромные и дорогостоящие датасеты с записями движений роботов. GEN-0 и GEN-1 обучались исключительно на данных с носимых устройств, которые надевали живые люди. Никаких роботизированных данных в обучающей выборке не было вообще. Это делает подход значительно дешевле и масштабируемее.
Generalist честно оговаривается: GEN-1 не решает все задачи. Высокие цифры успешности относятся к конкретным, хорошо определённым операциям — складыванию, упаковке, проверке. За пределами этих сценариев модель пока ограничена.
Тем не менее сдвиг принципиальный. Роботы давно умеют точно повторять одни и те же движения в контролируемой среде. Справляться с хаосом реального мира — совсем другое дело. GEN-1 зафиксировала 99% успешности — в том числе в ситуациях, когда робота намеренно прерывали.