ИИ научился самостоятельно разбивать сложные задачи на простые

Швейцарская исследовательская компания Tufa Labs представила новый метод самообучения больших языковых моделей. Под названием LADDER (Learning through Autonomous Difficulty-Driven Example Recursion), результаты которого буквально взорвали экспертное сообщество. Например, модель Llama 3.2 3B, которая изначально успешно решала всего 1% интегралов университетского уровня, после применения метода LADDER смогла правильно решить 82% таких задач.

Ещё более впечатляющим стал результат модели Qwen2.5 7B Deepseek-R1 Distilled, которая с помощью LADDER достигла точности 73% на квалификационном экзамене MIT Integration Bee. Для сравнения, люди обычно показывают результат в 15-30%, а GPT-4o от OpenAI — всего 42%. Суть технологии заключается в том, что ИИ-системы учатся автономно, без дополнительных данных или вмешательства человека, рекурсивно генерируя и решая всё более простые варианты сложных задач.

В отличие от традиционных подходов, требующих курируемых наборов данных или человеческой обратной связи, LADDER использует собственные возможности модели для создания более простых вариантов вопросов.

Этот колоссальный скачок производительности был достигнут без увеличения размера модели или дополнительного обучения на внешних данных.

Исследователи также представили концепцию TTRL (Test-Time Reinforcement Learning), позволяющую выполнять обучение с подкреплением на вариантах тестовых задач во время вывода. С этой технологией модель Qwen2.5 7B Deepseek-R1 Distilled достигла рекордного показателя — 90% на экзамене MIT Integration Bee, превзойдя даже производительность модели OpenAI o1.

Хотя пока LADDER остаётся исследовательской концепцией, в профессиональных сообществах уже активно обсуждают, что эта технология может стать важным шагом на пути к созданию искусственного общего интеллекта (AGI). Эксперты отмечают, что главное преимущество метода — способность моделей к самосовершенствованию без масштабирования архитектуры или человеческого надзора, что открывает новые горизонты в развитии мыслящих ИИ-систем.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.