Microsoft оценил человеческие возможности по определению ИИ-графики

Масштабное исследование, проведенное подразделением Microsoft AI for Good, выявило критические ограничения человеческих возможностей по идентификации синтетического визуального контента. Средний показатель успешного распознавания изображений, сгенерированных ИИ, составляет всего 62% — уровень, едва превышающий случайное угадывание.

Методология исследования опиралась на интерактивный формат: более 12,5 тысяч участников из различных географических регионов проходили тест «Правда или нет», в рамках которого требовалось отличить подлинные фотографии от синтетически сгенерированных изображений.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Экспериментальная выборка охватила 287 тысяч визуальных материалов. Важно отметить, что исследователи намеренно отказались от селективного отбора изображений, что позволило сформировать репрезентативную базу, отражающую реальный спектр генеративных возможностей современных систем.

Анализ результатов выявил значительную вариативность в способности распознавания в зависимости от типа изображений. Примечательно, что участники демонстрировали повышенную точность при работе с портретными изображениями.

Данный феномен может объясняться эволюционно закрепленными нейрокогнитивными механизмами распознавания человеческих лиц, что позволяет идентифицировать даже незначительные аномалии в синтетических портретах.

Существенное снижение точности идентификации — до уровня 59-61% — наблюдалось при анализе природных и городских пейзажей.

Данная категория изображений представляет повышенную сложность для человеческого восприятия ввиду отсутствия очевидных визуальных маркеров искусственного происхождения и наличия сложных текстурных паттернов, которые современные генеративные модели воспроизводят с высокой достоверностью.

Отдельного внимания заслуживает выявленная закономерность: изображения, созданные с использованием более ранних технологий — генеративно-состязательных сетей (GAN) и методов инпейнтинга — демонстрировали повышенную способность вводить участников в заблуждение.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.