下载客户端

法治的细节︱机器学习侵犯版权吗？

陈绍玲

2024-01-08 08:34

来源：澎湃新闻

∙ 澎湃研究所 >

背景

人工智能技术的应用是大势所趋，人工智能产业将成为大国科技竞争的重点领域。人工智能技术的核心在于机器学习，训练人工智能掌握近似人类的学习能力。通过这样的训练，人工智能可以掌握图片修改、视频制作、文字写作等能力。

当然，要训练人工智能掌握这样的学习能力，必须对其“投喂”大量作品，通过作品的“投喂”使人工智能掌握生成新内容的算法。这会导致人工智能技术开发者与被“投喂”作品的权利人之间的冲突。

如2023年上半年美国艺术家萨拉·安德森等起诉Stability AI等人工智能公司案，下半年美国喜剧演员萨拉·西尔弗曼等起诉Meta公司和OpenAI公司案，就是这种冲突在现实中的反映。最近，随着《纽约时报》与OpenAI的谈判陷入僵局，《纽约时报》也对OpenAI提起了类似诉讼，可见在立法和司法上解决类似冲突的必要性。

一、人工智能输出内容与“投喂”的作品大概率不相似

在上诉案件中，无论是美国艺术家萨拉·安德森等起诉Stability AI等人工智能公司案，还是萨拉·西尔弗曼等起诉Meta公司和OpenAI公司案，作品权利人的大部分诉请均被法院驳回，唯一保留的是美国艺术家萨拉·安德森指控Stability AI侵害复制权的诉请。这是因为，在以上案件中，原告无法证明其作品与被告运营的人工智能生成物构成实质性相似，这就无法证明被告侵害了原告的版权。

这反映了人工智能生成内容的特点，训练人工智能时输入的作品与训练完成后人工智能输出的结果之间并无必然相似的关系。这也充分说明了，人工智能生成内容与训练人工智能输入的作品之间并无直接竞争。

当然，最近的纽约时报诉OpenAI案表明，纽约时报主张OpenAI生成内容与《纽约时报》的文字作品雷同。如果纽约时报的主张属实，就说明人工智能技术远不如公众想象的成熟，人工智能算法有受到现实法律规则和社会伦理约束的必要性。

二、日本外的多数国家未就人工智能训练使用他人作品的行为定性表态

尽管训练人工智能时输入的作品与训练完成后人工智能输出的结果之间并不必然相似，但训练人工智能时会不可避免地利用权利人的作品。

在美国艺术家萨拉·安德森等诉Stability AI人工智能公司等案中，如果Stability AI公司最终被法院认定复制了原告的作品，除非Stability AI的行为符合著作权限制制度，否则无法免于承担法律责任。

各国著作权法普遍存在著作权限制制度，该项制度的核心是对著作权人的权利作出限制，豁免特定情况下的侵权法律责任。该类制度的作用是为了平衡个人权利与公共利益之间的冲突。例如学生群体为了个人学习的目的少量复制公共图书馆的图书，再如游客在公共场所拍照时不可避免地复制雕塑、建筑等作品。

人工智能技术开发者训练人工智能的过程中会不可避免地复制权利人作品，除非该种复制行为构成“合理使用”，否则人工智能技术的开发者难以摆脱法律责任。

就是否对训练人工智能过程中复制权利人作品的行为适用“合理使用”制度，大多数国家尚未在立法和司法层面作出回应。例如欧洲国家的著作权法明确规定了著作权限制制度的适用情形，但目前未有国家明确规定训练人工智能过程中复制权利人作品的行为适用著作权限制制度。

美国版权法的权利限制制度被称为“合理使用”，不同于适用情形特定的欧洲国家的著作权限制制度，这种合理使用制度仅规定了若干判定合理使用的要素。实践中，美国法院需要结合该若干要素和在先判例判决特定行为是否构成合理使用。正如上文所言，尽管美国有多起作品权利人与AI公司之间的诉讼，但美国法院尚未就训练人工智能过程中复制权利人作品的行为是否构成合理使用表态。

不同于欧美，日本政府明确表态，日本著作权法既有的“文本与数据挖掘”限制制度可以适用于人工智能训练时使用他人作品的行为。尽管政府的主张尚未得到法院判决的确认，但日本政府的态度表明其谋求人工智能产业发展的迫切性。在发达国家中，日本人工智能产业发展的优势并不明显，因此急切需要法律为人工智能产业松绑，从而实现人工智能产业发展的弯道超车。

日本、美国和欧盟普遍认可“数据挖掘（使用计算机分析海量数据获取有价值信息）”限制规则，“数据挖掘”限制制度与人工智能并无必然关联，但日本巧妙地将“数据挖掘”限制制度扩张到人工智能场合，解决了人工智能训练使用他人作品行为的定性问题。

日本政府的政策表明国家利益对著作权限制制度的影响，更充分说明了人工智能相关制度具备很强的国家政策性。

三、我国应当为人工智能训练使用他人作品行为构建合理使用制度

在我国，已有企业开展了人工智能技术的研发和应用，同样存在利用权利人作品训练人工智能的情形，其中的版权纠纷不可避免。目前已经有权利人对企业使用其作品训练人工智能的行为提起民事诉讼。因此，在我国为训练人工智能使用他人作品的行为是否构成合理使用，成为亟待解决的问题。

我国《著作权法》规定了“12+1”种“合理使用”情形，其中“12”是特定的“合理使用”情形，“1”是“法律、行政法规规定的其他情形”，即兜底条款。目前法定的“12+1”种“合理使用”情形并不包含为训练人工智能使用他人作品的行为，《著作权法实施条例》和《信息网络传播权保护条例》尚未修订，目前也未将为训练人工智能使用他人作品的行为定性为合理使用。

尽管立法未有明确规定，但理论上将为训练人工智能使用他人作品的行为定性为合理使用仍有一定的空间。

根据我国《著作权法》，“合理使用”行为必须符合“三步检验法”，即“特殊情况下使用作品”，“不得影响该作品的正常使用”，“也不得不合理地损害著作权人的合法权益”。其中的“特殊情况”即《著作权法》法定的12种合理使用情形，当然司法解释也有扩张合理使用情形的先例。“不得影响该作品的正常使用”要求使用者不得与作品权利人开展直接的市场竞争，不允许使用者的创作直接替代权利人的作品。“不得不合理地损害著作权人的合法权益”是指，“合理使用”的行为是对著作权人利益的损害，尽管这种损害的发生不可避免，但使用者应将这种损害限定在最小限度。

正如上文所言，人工智能训练时输入的作品与其输出结果之间并无必然相似的关系，人工智能的输出结果取决于其算法，其输出结果具有不特定性。大部分情况下，人工智能训练时输入的作品与其输出的结果是不构成实质性相似的。这意味着人工智能的输出结果不会与权利人的作品直接展开市场竞争，不会影响权利人作品的市场。

也就是说，尽管利用权利人作品训练人工智能的行为不在法定的特殊情形之内，但该种行为实质上符合合理使用的“三步检验标准”。

当然，为训练人工智能使用他人作品的行为，不可避免会导致权利人的损失。对此，有研究建议对训练人工智能使用他人作品的合理使用情形进行限缩。如有美国学者认为应保障教学和科研实体的权利，建议只有为了非商业、教学和科研目的利用权利人作品训练人工智能的行为才可以构成合理使用。

这种折中方案，避免了将任何利用权利人作品训练人工智能的行为认定为合理使用，给作品权利人造成的损失，在一定程度上维护了权利人的利益。但人工智能产业的发展需要大算力和尖端硬件的支持，教学、科研机构并无法承担其中的成本。因此，仅允许教学科研机构训练人工智能目的使用他人作品，并无法实现人工智能的发展。

当然，从维护权利人利益的角度，可以对训练人工智能利用他人作品的行为采法定许可制度，即人工智能的运营者可以未经许可利用权利人作品训练人工智能，但应当向权利人支付费用。相比“合理使用”制度，法定许可制度照顾了权利人的利益，更为合理。

但人工智能技术存在“技术黑箱”，人工智能训练过程中使用了何人的何种作品，使用的数量具体是多少，都是难以确定的。此外，我国的著作权集体管理经验尚不丰富，现行法下很难有集体管理组织代表权利人参与谈判，并维护权利人的利益。就此而言，法定许可制度看似美好，但缺乏实施层面的可行性。

因此，从促进人工智能产业发展的角度，应在利用权利人作品训练人工智能的行为是否构成合理使用的问题上采取宽松政策，即任何为训练人工智能利用他人作品的行为均应免责。

结语

人工智能对人类社会最深远的影响在于，人工智能对人类劳动的取代，将影响特定群体的生存。随着人工智能技术的不断成熟，即使是没有经过专业训练的业余人士，也可以通过计算机指令生成大量的影视、音乐、文字或美术作品。这样一来，传统艺术创作者的市场竞争力无疑会受到影响，而人工智能的这种能力依赖于对传统艺术创作者作品的学习，因此不可能不遭到传统艺术创作者的反对。

这是时代接受技术革新和应用的必然结果，而非合理使用制度导致的恶果。

-----

作者陈绍玲，系华东政法大学知识产权学院副教授。法治中国，不在宏大的叙事，而在细节的雕琢。在“法治的细节”中，让我们超越结果而明晰法治的脉络。

责任编辑：单雪菱

校对：丁晓

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#法治的细节 #合理使用制度 #版权 #机器学习