Федеральный суд Калифорнии принял к рассмотрению коллективный иск против компании Anthropic на сумму 1 млрд долларов. Разработчик языковой модели Claude обвиняется в систематическом нарушении авторских прав при создании обучающих наборов данных.
Согласно судебному постановлению, в период 2021-2022 годов компания использовала протокол BitTorrent для массовой загрузки контента с пиратских ресурсов LibGen и PiLiMi. Судья Уильям Олсап охарактеризовал эти действия как «скачивание миллионов произведений в стиле Napster».
В документах суда указано, что один из соучредителей Anthropic сначала загрузил около 200 000 книг из коллекции Books3, затем приблизительно пять миллионов изданий из LibGen и дополнительно два миллиона с PiLiMi, целенаправленно отбирая материалы, отсутствующие в первом источнике.
Все полученные файлы форматов .epub, .pdf и .txt хранились во внутренней базе данных Anthropic независимо от их последующего использования для обучения моделей искусственного интеллекта. Этот факт существенно усложняет юридическую позицию компании.
Учитывая объем и сложность доказательств, суд постановил рассматривать дело как коллективный иск. В рассмотрение включены только произведения из LibGen и PiLiMi, контент из Books3 исключен из-за недостаточности метаданных для идентификации правообладателей.