Исследователи из Калифорнийского университета в Сан-Диего опубликовали первое рецензируемое эмпирическое доказательство того, что современный языковой ИИ проходит классический тест Тьюринга. Причём проходит убедительнее, чем сами люди.
Тест Тьюринга — это проверка, где судья общается текстом одновременно с человеком и машиной, не зная, кто есть кто. Задача — определить, где человек. Если машину принимают за человека чаще, чем нет — она считается прошедшей тест.
В эксперименте судьи чаще принимали ИИ за человека, чем реальных участников. Это значит: ИИ не просто «похож» на человека — он убедительнее в этой роли, чем мы сами.
До этой работы существовали неформальные отчёты и демонстрации, но рецензируемых научных данных не было. Теперь есть.
Алан Тьюринг предложил этот тест в 1950 году как критерий разумности машины. Долгое время он считался скорее мысленным экспериментом, чем реальным испытанием. Языковые модели последнего поколения изменили это: они умеют вести диалог так, что люди их не распознают.
Важно понимать: это не значит, что ИИ «думает» или «осознаёт себя». Тест Тьюринга — про имитацию поведения, а не про понимание. ИИ настолько хорошо воспроизводит человеческий стиль общения, что люди-судьи ошибаются чаще, чем угадывают.
Это первое рецензируемое подтверждение за 76 лет существования теста. Впервые с формальной научной строгостью зафиксировано: граница между человеческим и машинным текстом для обычного наблюдателя практически стёрлась.