大英百科全书起诉OpenAI侵犯知识产权

大英百科全书及其子公司韦氏词典于3月14日向曼哈顿联邦法院提起诉讼,指控OpenAI在未获授权的情况下,大规模复制其在线内容用于训练GPT系列大语言模型。诉状指出,OpenAI非法获取并使用了接近十万篇大英百科文章、词条解释及词典释义,相关数据被嵌入至ChatGPT的生成机制中。

生成内容与原文高度相似引用户流失担忧

原告强调,部分由ChatGPT输出的回复与大英百科原始条目在文字表达上几乎完全一致,构成实质性复制。这种高度相似性导致原本应访问大英百科官网的用户转向AI工具获取信息,造成直接流量损失与商业价值减损。

商标权滥用与虚假信息传播成新指控焦点

除版权问题外,大英百科还提出商标侵权指控:一是认为OpenAI在产品宣传或模型行为中制造了“已获授权”的假象;二是指其生成内容中频繁出现错误引用,将虚构信息伪称为源自大英百科全书,损害品牌声誉与公众信任。

OpenAI回应:基于公开数据合理使用

针对诉讼,OpenAI发言人表示,其模型依托公开可获取的数据进行训练,符合合理使用原则,旨在推动技术进步与创新。公司强调未主动诱导用户误认内容来源,并否认存在系统性侵权行为。

同类案件仍在审理,行业合规压力上升

值得注意的是,大英百科去年已对另一AI搜索初创公司Perplexity AI提起类似诉讼,该案目前仍处于审理阶段。此次对OpenAI的起诉进一步凸显当前人工智能产业在数据采集、内容使用与责任边界方面面临的法律挑战,也反映出内容机构对自身数字资产保护的强烈诉求。