Adobe обвинили в использовании пиратских книг для ИИ

Против Adobe подали коллективный иск из-за использования пиратских книг для обучения искусственного интеллекта. Писательница Элизабет Лайон из Орегона обвинила компанию в использовании ее работ без разрешения. Adobe применила материалы для обучения языковой модели SlimLM.

Adobe описывает SlimLM как серию малых языковых моделей для работы с документами на мобильных устройствах. Компания заявляет, что модель обучалась на датасете SlimPajama-627B. Это открытый набор данных, который выпустила компания Cerebras в июне 2023 года.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Лайон написала несколько учебников по писательскому мастерству. Ее работы попали в набор данных для предварительного обучения модели Adobe. По данным Reuters, иск утверждает, что датасет SlimPajama создали путем копирования и обработки датасета RedPajama.

RedPajama включает в себя коллекцию Books3. Это огромный набор из 191 тысячи книг, который используют для обучения систем генеративного ИИ. Books3 уже стал источником множества судебных разбирательств в технологической индустрии.

В сентябре против Apple подали похожий иск. Компанию обвинили в использовании материалов из RedPajama для обучения модели Apple Intelligence. Истцы заявили, что Apple копировала защищенные авторским правом работы без согласия, упоминания и компенсации авторам.

В октябре аналогичный иск подали против Salesforce. Компанию также обвинили в использовании датасета RedPajama для обучения своих моделей. Такие судебные разбирательства стали обычным делом для технологической индустрии.

Алгоритмы искусственного интеллекта обучают на огромных наборах данных. В некоторых случаях эти наборы включают пиратские материалы. Это создает серьезные юридические проблемы для компаний.

В сентябре Anthropic согласилась заплатить 1,5 миллиарда долларов группе авторов. Писатели обвинили компанию в использовании пиратских версий их книг для обучения чат-бота Claude. Дело считают поворотным моментом в судебных битвах вокруг авторских прав в обучении ИИ.

Adobe активно развивает направление искусственного интеллекта последние несколько лет. Компания запустила множество сервисов на базе ИИ с 2023 года. Среди них — Firefly, набор инструментов для генерации медиаконтента с помощью ИИ.

Автор: Анна Маркова
Специализируется на технологической журналистике с фокусом на искусственный интеллект. Пишет о реальном применении ИИ в бизнесе и повседневной жизни.