Против Adobe подали коллективный иск из-за использования пиратских книг для обучения искусственного интеллекта. Писательница Элизабет Лайон из Орегона обвинила компанию в использовании ее работ без разрешения. Adobe применила материалы для обучения языковой модели SlimLM.
Adobe описывает SlimLM как серию малых языковых моделей для работы с документами на мобильных устройствах. Компания заявляет, что модель обучалась на датасете SlimPajama-627B. Это открытый набор данных, который выпустила компания Cerebras в июне 2023 года.
Узнать подробнее про клуб ShareAI
Лайон написала несколько учебников по писательскому мастерству. Ее работы попали в набор данных для предварительного обучения модели Adobe. По данным Reuters, иск утверждает, что датасет SlimPajama создали путем копирования и обработки датасета RedPajama.
RedPajama включает в себя коллекцию Books3. Это огромный набор из 191 тысячи книг, который используют для обучения систем генеративного ИИ. Books3 уже стал источником множества судебных разбирательств в технологической индустрии.
В сентябре против Apple подали похожий иск. Компанию обвинили в использовании материалов из RedPajama для обучения модели Apple Intelligence. Истцы заявили, что Apple копировала защищенные авторским правом работы без согласия, упоминания и компенсации авторам.
В октябре аналогичный иск подали против Salesforce. Компанию также обвинили в использовании датасета RedPajama для обучения своих моделей. Такие судебные разбирательства стали обычным делом для технологической индустрии.
Алгоритмы искусственного интеллекта обучают на огромных наборах данных. В некоторых случаях эти наборы включают пиратские материалы. Это создает серьезные юридические проблемы для компаний.
В сентябре Anthropic согласилась заплатить 1,5 миллиарда долларов группе авторов. Писатели обвинили компанию в использовании пиратских версий их книг для обучения чат-бота Claude. Дело считают поворотным моментом в судебных битвах вокруг авторских прав в обучении ИИ.
Adobe активно развивает направление искусственного интеллекта последние несколько лет. Компания запустила множество сервисов на базе ИИ с 2023 года. Среди них — Firefly, набор инструментов для генерации медиаконтента с помощью ИИ.

