NVIDIA 遭版权诉讼修正起诉,被指联系影子图书馆获取 500 TB 盗版数据

据多名作家向美国加州北区联邦地区法院提交的修正起诉书披露,NVIDIA 为训练 NeMo 等大语言模型,曾主动联系影子图书馆 Anna's Archive 寻求获取数百万本盗版书籍。内部邮件显示,该公司的数据策略团队在对方明确提醒馆藏资源系非法获取后,仍获得管理层授权,拟获取约 500 TB 的数据。起诉书指控 NVIDIA 在竞争压力下转向盗版,其训练数据源还涉及 LibGen、Sci-Hub 及 Z-Library。

Torrentfreak

🍀在花频道 🍵茶馆聊天 📮投稿
来自频道: @zaihuapd
Loading comments...