Microsoft разрабатывает систему оплаты авторам, чьи работы использует ИИ

Microsoft запускает исследовательский проект, который позволит оценивать влияние конкретных обучающих примеров на текст, изображения и другие типы медиа, создаваемые генеративными моделями ИИ. И что модели могут быть обучены таким образом, что влияние конкретных данных — например, фотографий и книг — на их выходные результаты можно будет «эффективно и полезно оценивать».

«Современные архитектуры нейронных сетей непрозрачны в плане предоставления источников для своих генераций, и есть веские причины изменить это», — говорит Microsoft. «Одна из них — стимулы, признание и потенциально оплата для людей, которые предоставляют определённые ценные данные для  моделей, которые нам понадобятся в будущем, предполагая, что будущее нас фундаментально удивит».

Генераторы текста, кода, изображений, видео и песен с поддержкой ИИ находятся в центре ряда судебных исков о нарушении интеллектуальной собственности против компаний, занимающихся искусственным интеллектом. Зачастую эти компании обучают свои модели на огромных объёмах данных с публичных веб-сайтов, часть которых защищена авторским правом. Многие из компаний утверждают, что доктрина добросовестного использования защищает их практики сбора данных и обучения. Но творческие люди — от художников до программистов и авторов — в основном не согласны с этим.

Сама Microsoft сталкивается как минимум с двумя юридическими вызовами от правообладателей. The New York Times подала в суд на технологического гиганта и его временного партнёра, OpenAI, в декабре, обвиняя обе компании в нарушении авторских прав The Times путём развёртывания моделей, обученных на миллионах её статей. Несколько разработчиков программного обеспечения также подали иск против Microsoft, утверждая, что помощник компании по программированию с ИИ GitHub Copilot был незаконно обучен с использованием их защищённых произведений.

Новое исследовательское усилие Microsoft, которое в объявлении описывается как «отслеживание происхождения во время обучения», по сообщениям, проводится при участии Джарона Ланье, известного технолога и междисциплинарного учёного из Microsoft Research. В своей статье для The New Yorker в апреле 2023 года Ланье писал о концепции «достоинства данных», что для него означало соединение «цифрового материала» с «людьми, которые хотят быть известными как его создатели».

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.