Группа авторов расширила коллективный иск против Nvidia. Теперь компанию обвиняют в сознательном использовании пиратских библиотек для обучения ИИ-моделей. TorrentFreak опубликовал детали обновленной жалобы.
Центральный эпизод — переговоры Nvidia с теневой библиотекой Anna’s Archive. По версии истцов, компания под конкурентным давлением искала способ быстро получить огромные объемы текстов для тренировки моделей.
Узнать подробнее про клуб ShareAI
Nvidia запросила высокоскоростной доступ к коллекции Anna’s Archive. Администраторы библиотеки не скрывали, что контент собран незаконно. Они прямо предупредили представителей компании об этом и потребовали внутреннее одобрение сделки.
Неделя ушла на согласование. После этого руководство Nvidia дало зеленый свет. Anna’s Archive открыла доступ к своим серверам.
Объем данных впечатляет — около 500 ТБ. Это миллионы книг, включая материалы из Internet Archive, которые обычно доступны только через систему цифровой выдачи. Авторы утверждают, что Nvidia использовала эти тексты без разрешения и не заплатила ни цента.
Но история не ограничивается Anna’s Archive. В жалобе перечислены другие пиратские источники — LibGen, Sci-Hub, Z-Library и датасет Books3. Получается, Nvidia систематически обращалась к нелегальным библиотекам.
Это поднимает серьезный вопрос. Знала ли компания о незаконности источников? Если да, то это не ошибка, а осознанный выбор. Факт запроса внутреннего одобрения говорит, что юридическая служба Nvidia точно была в курсе.
Гонка за данными для ИИ создает сильный стимул нарушать авторские права. Легальные датасеты стоят дорого и требуют долгих переговоров с правообладателями. Пиратские библиотеки дают доступ к миллионам книг моментально и бесплатно.
Nvidia не первая в этом списке. OpenAI, Meta и другие компании уже сталкиваются с похожими исками. Но случай с Nvidia особенный — здесь есть прямые доказательства переписки и согласования сделки с пиратским ресурсом.
Если суд встанет на сторону авторов, последствия будут значительными. Коллективный иск может стоить компании миллионы. Но важнее репутационный ущерб — Nvidia позиционирует себя как ответственный игрок на рынке ИИ.
Дело также задает прецедент для всей индустрии. Можно ли использовать пиратский контент для обучения ИИ под предлогом добросовестного использования? Или это прямое нарушение авторских прав? Суд даст ответ, который повлияет на будущее всей отрасли.

