Microsoft разрабатывает систему оплаты авторам, чьи работы использует ИИ

Microsoft разрабатывает систему оплаты авторам, чьи работы использует ИИ

Microsoft запускает исследовательский проект, который позволит оценивать влияние конкретных обучающих примеров на текст, изображения и другие типы медиа, создаваемые генеративными моделями ИИ. И что модели могут быть обучены таким образом, что влияние конкретных данных — например, фотографий и книг — на их выходные результаты можно будет «эффективно и полезно оценивать».

«Современные архитектуры нейронных сетей непрозрачны в плане предоставления источников для своих генераций, и есть веские причины изменить это», — говорит Microsoft. «Одна из них — стимулы, признание и потенциально оплата для людей, которые предоставляют определённые ценные данные для  моделей, которые нам понадобятся в будущем, предполагая, что будущее нас фундаментально удивит».

Генераторы текста, кода, изображений, видео и песен с поддержкой ИИ находятся в центре ряда судебных исков о нарушении интеллектуальной собственности против компаний, занимающихся искусственным интеллектом. Зачастую эти компании обучают свои модели на огромных объёмах данных с публичных веб-сайтов, часть которых защищена авторским правом. Многие из компаний утверждают, что доктрина добросовестного использования защищает их практики сбора данных и обучения. Но творческие люди — от художников до программистов и авторов — в основном не согласны с этим.

Сама Microsoft сталкивается как минимум с двумя юридическими вызовами от правообладателей. The New York Times подала в суд на технологического гиганта и его временного партнёра, OpenAI, в декабре, обвиняя обе компании в нарушении авторских прав The Times путём развёртывания моделей, обученных на миллионах её статей. Несколько разработчиков программного обеспечения также подали иск против Microsoft, утверждая, что помощник компании по программированию с ИИ GitHub Copilot был незаконно обучен с использованием их защищённых произведений.

Новое исследовательское усилие Microsoft, которое в объявлении описывается как «отслеживание происхождения во время обучения», по сообщениям, проводится при участии Джарона Ланье, известного технолога и междисциплинарного учёного из Microsoft Research. В своей статье для The New Yorker в апреле 2023 года Ланье писал о концепции «достоинства данных», что для него означало соединение «цифрового материала» с «людьми, которые хотят быть известными как его создатели».

Ирина Задорожная
Ирина Задорожная

Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.