Масштабное исследование, проведенное подразделением Microsoft AI for Good, выявило критические ограничения человеческих возможностей по идентификации синтетического визуального контента. Средний показатель успешного распознавания изображений, сгенерированных ИИ, составляет всего 62% — уровень, едва превышающий случайное угадывание.
Методология исследования опиралась на интерактивный формат: более 12,5 тысяч участников из различных географических регионов проходили тест «Правда или нет», в рамках которого требовалось отличить подлинные фотографии от синтетически сгенерированных изображений.
Узнать подробнее про клуб ShareAI
Экспериментальная выборка охватила 287 тысяч визуальных материалов. Важно отметить, что исследователи намеренно отказались от селективного отбора изображений, что позволило сформировать репрезентативную базу, отражающую реальный спектр генеративных возможностей современных систем.
Анализ результатов выявил значительную вариативность в способности распознавания в зависимости от типа изображений. Примечательно, что участники демонстрировали повышенную точность при работе с портретными изображениями.
Данный феномен может объясняться эволюционно закрепленными нейрокогнитивными механизмами распознавания человеческих лиц, что позволяет идентифицировать даже незначительные аномалии в синтетических портретах.
Существенное снижение точности идентификации — до уровня 59-61% — наблюдалось при анализе природных и городских пейзажей.
Данная категория изображений представляет повышенную сложность для человеческого восприятия ввиду отсутствия очевидных визуальных маркеров искусственного происхождения и наличия сложных текстурных паттернов, которые современные генеративные модели воспроизводят с высокой достоверностью.
Отдельного внимания заслуживает выявленная закономерность: изображения, созданные с использованием более ранних технологий — генеративно-состязательных сетей (GAN) и методов инпейнтинга — демонстрировали повышенную способность вводить участников в заблуждение.