施小雪｜重塑复制权：生成式人工智能数据训练的合法化路径

新技术法学 · 公众号 · 科技媒体法律 · 2025-06-08 08:10

主要观点总结

生成式人工智能的数据训练遭遇法律障碍，根源在于对复制权进行宽泛的权利扩张。为合法化数据训练中复制作品的行为，应重塑复制权而非重塑合理使用。在权利法视角下，重塑复制权应对复制权的功能进行重新定位，以“固定性+传播性”定义侵犯复制权的行为。在技术发展的早期阶段，应配合著作权注意义务的施加，促进平台改进技术控制和内容生成能力。在指令端及输出端符合著作权注意义务的阶段性场景要求，以及获取作品的行为没有违背权利人的意愿时，数据训练中的复制可视为不具备“传播性”而不构成对复制权的侵犯。当前，生成式人工智能的著作权侵权风险主要是技术发展不成熟期的过程性问题，在现有的著作权法框架下，无法脱离“接触+实质性相似”侵权判定规则。文章提出通过解释论路径重塑复制权，以“固定性+传播性”构成要件解释侵犯复制权的行为，并补充以技术发展的前瞻性视角进行回应。在符合著作权注意义务的阶段性场景要求时，上述复制行为可定性为不具备“传播性”，应属不侵犯复制权的行为。

关键观点总结

关键观点1: 生成式人工智能数据训练遭遇法律障碍的原因

生成式人工智能的数据训练遭遇法律障碍，根源在于对复制权进行宽泛的权利扩张。

关键观点2: 合法化数据训练中复制作品行为的解决方案

为合法化数据训练中复制作品的行为，应重塑复制权，而非重塑合理使用。

关键观点3: 重塑复制权的重要性

在权利法视角下，重塑复制权应对复制权的功能进行重新定位，以“固定性+传播性”定义侵犯复制权的行为。

关键观点4: 著作权注意义务在技术发展中的作用

在技术发展的早期阶段，应配合著作权注意义务的施加，促进平台改进技术控制和内容生成能力。

关键观点5: 现有著作权法框架下的著作权侵权风险

当前，生成式人工智能的著作权侵权风险主要是技术发展不成熟期的过程性问题，在现有的著作权法框架下，无法脱离“接触+实质性相似”侵权判定规则。

关键观点6: 重塑复制权的解释论路径

文章提出通过解释论路径重塑复制权，以“固定性+传播性”构成要件解释侵犯复制权的行为，并补充以技术发展的前瞻性视角进行回应。

关键观点7: 符合著作权注意义务的场景要求

在符合著作权注意义务的阶段性场景要求时，数据训练中的复制可视为不具备“传播性”，应属不侵犯复制权的行为。

正文

请到「今天看啥」查看全文

复制权的扩张带来不少新问题，问题之一就是影响公众的福祉。在数字环境下，复制与作品传播间不可分割的关联减弱。在数字环境中，复制是一种广泛且必要的存在，浏览网页、缓存、链接、下载、访问信息以及在线服务等操作，都涉及复制。如果将这些形式的复制都视为对复制权的侵犯，几乎公众在数字环境下的每项行为都会触发复制权侵权。

复制权扩张引发的另一个问题是，推高了新兴产业发展的成本。在复制权诞生之初，文化生产在西方社会是经济过程中的一个重要组成部分，维持国家的繁荣与强大要求对作者及著作权产业予以重视。但在不断出现新的生产力背景下，如果冻结市场、弱化竞争、继续维持现状甚至形成新的垄断，国家将会面临维持竞争优势的挑战。国家的经济是流动状态的，这种流动状态是不断出现的各种生产力相互影响和竞争造成的。此时，国家追求什么样的政策，并将其作为法律制订的指导，会成为下一个经济发展阶段成功与失败的分水岭。

为了消解权利范围规定过宽所引发的负面影响，在各方利益的权衡之下，《伯尔尼公约》在第9条规定，公约联盟成员国的法律有权允许在某些特殊情况下复制上述作品，只要这种复制不致损害作品的正常使用也不致无故侵害作者的合法利益。该条被认为是对复制权的一种合理使用限制。于是，何种情形下的复制行为应当落入合理使用的范围，从而得到侵权的豁免，便成为解决复制权效力范围过宽的一般路径。但这也引发另外一个法律难题，那就是合理使用规则的内容也开始不断扩张，并逐渐变得缺乏逻辑性且越来越难以预测。当合理使用规则开始被频繁动用，并成为著作权法领域中最为疑难复杂的问题时，对合理使用的质疑及反思也随之开始。

质疑合理使用的理由主要为：一是对合理使用概括困难，立法难以穷尽全部情形，在法律的明确规定之外，其他情形下合理使用的考量因素均依赖法院裁量。不同法官对合理使用规则的认识存在分歧，不受统一原则的支配，更多源于对各个事实类型的直觉反应，加剧了合理使用的不确定性。在索尼案中，多数派虽然支持纯粹为个人欣赏而复制电影、电视直播节目等可以构成合理使用，但是这一结论的得出非常依赖消费者很少跳过广告或长期保存电影录像这一事实。因为多数派认为这一事实不会减少原告作品的广告收入，从而对原告作品的潜在市场或价值没有造成显著损害。如果案件中缺乏这一偶然性的事实，很难预测当年的索尼案是否还会作出同样的判决。二是随着作品使用新方式的不断出现，合理使用既有理论对于评估变革性的使用非常有效，但不适合评估非变革性的个人使用复制。

（二）

复制权功能的合理定位

解决问题的根源在于权利本身。在权利法的视角下，当合理使用变得越来越庞杂和难以决断时，其实问题并不是出在什么是合理使用，而是出在什么是应当受到保护的权利。合理使用是专有权利的衍生概念，而非原始概念，起决定性作用的，应该是权利本身。当合理使用本身变得“怪异、具有偶然性”时，如果继续调整合理使用，不过是在现有的“补丁”之上再次增设“补丁”。面对“补丁”重重的制度，其实应当反思现有著作权的权利设计是否垄断了太多的公共利益。从私人复制、系统缓存到某平台数字图书馆案、云计算存储案，乃至生成式人工智能数据训练案，需要解决的问题本质都是一样的，就是进一步明晰其效力范围，从根本上解决因技术变迁而持续带来的复制难题。

复制权是时代的产物，其效力范围的合理划定无法脱离促使其诞生的社会背景。复制权的诞生初衷是控制出版商的“传播”利益，且传播方式为有形的物理传播。而数字技术以及生成式人工智能技术之所以会带来复制难题，是因为新环境下的复制行为改变了复制方式，复制并非局限于有形物理载体的复制件，也并不必然会带来“传播”，或者说能够产生的“传播”效益在维权成本面前不值一提，以及产生的“传播”效益并不会对权利人原有的市场造成实质威胁等，印刷时代复制与传播间那种不可分割的联系没有了。在生成式人工智能的数据训练中，复制作品的方式包括数据收集、数据预处理、数据挖掘阶段的临时复制。当前也发展出了可在云服务器上进行的数据训练，这些副本被运行完之后就不需要再被人工智能系统保留。这些形式的复制不是为了传播，而是为了创造新内容。复制权生存的环境已经发生巨大变化，但如果不问复制的形式和目的，而将复制权的效力范围从印刷出版扩张到一切形式的复制，结果就只能通过不断增设权利的例外，为新环境下的利益平衡找到出路。初始诞生环境决定了复制权适宜具有的功能，当环境改变时，如果盲目扩张复制权而忽略其适宜生存的环境，只会导致扩张后的权利体系无法与新环境实现自洽。面对新技术下复制形式和目的的不断丰富，应当围绕复制权的初始诞生环境确定如何对复制权进行扩张解释。

回溯复制权的初始功能，其意义就在于控制线下作品的有形物理传播，其与作品的传播具有不可分割性，所以复制权从诞生之初就是一种具有依赖性的上游权利。因为传播直接对应着市场，市场应是复制权诞生的重要现实基础，而传播则是作品获取市场收益的重要表现形式。无论什么技术环境中的复制，只要其是作品传播的开始，那么控制这种复制，就能实现对相关市场的控制。所以必须明晰的一点是，复制权所划定的效力范围实际上是要控制作品的传播市场。只有行为人构成向公众提供作品时，著作权法才有介入的必要和实际意义。而对作为与市场行为相对应的非市场复制等行为，著作权法其实并没有回应的必要。如果需要著作权法进行回应，著作权人也应当证明复制行为所造成的损失，但实际情况是，著作权人自身也很难证明究竟是否会有实际损失，以及损失如何测算。

在生成式人工智能技术下，需要根据技术的发展目的，重点考量复制作品是否有损作者的经济利益。对于作者而言，被用于数据训练的作品如果处于“黑箱”中并未传出，理论上并不影响原作者的既有市场。传统的理念认为，作者获得作品商业性利用的许可使用费是一项基本的权利，但这种费用实质是将利润从技术的开发者部分转移到了作者，而这种利润转移并没有清晰的测算依据且难以执行，并会降低人工智能产业的大模型质量，影响新生产力乃至整个社会的经济运行效率。而如果将数据训练放置于生成式人工智能创作传播内容的整体过程中考量，新生产力会带来新的市场。生成式人工智能在提升人类创作作品的效率之时，可能也会面临创作同质化的危机。所以如果想使机器生成的内容具有市场价值，还需要使用者继续叠加人类的劳动，为机器创作增添稀缺的“独创性”。同时作者本身也可以借助生成式人工智能提升创作的效率。究竟是受损还是获益，难以有确凿的回答。新的生产动能正在路上，所谓对于原作者市场的潜在威胁这种不确定性的预测，最好的回应办法就是不回应。

除了市场的考量，也应重新定位复制权所控制的复制形式。复制的不可避免性，也决定了复制不应该再成为衡量侵权的恰当方式，例如，对于数字环境下的临时复制，坚持以技术过程不具有“固定性”为由，将临时复制、系统缓存合法化，否定了临时复制、系统缓存落入复制权的控制范畴，在对复制权所控制的复制形式进行合理界定的前提下，合理平衡权利人和公众的利益，也为新技术的发展开辟了空间，防止复制权在数字技术之下扩张为“专有阅读权”。 2001年欧洲议会和理事会发布《信息社会著作权与相关权利指令》，在其中的第5条规定了临时复制的侵权豁免，明确当发生于数字环境传输中的复制行为是“暂时的”“在技术过程中必然发生的”，且“不具有独立的经济价值”时，应当豁免构成复制权侵权。巴西著作权法第30（1）条也明确规定，如果复制是临时的，且复制的唯一目的是使作品、录音制品或表演可以通过电子媒介的方式被感知，或者复制是短暂的或偶然的，且复制是在获得著作权人的适当授权后使用作品的过程中所为，则不应适用复制专有权。法国知识产权法典在第L.122-5（6）条规定，作者不得禁止作品发表后的下列复制： “过渡性或附属性的临时复制，该复制必须是某个技术方案完整和基本的组成部分，该复制仅在于允许作品的合法使用或借助中介网络在第三人之间的传播；但该临时复制仅适用于软件和数据库以外的作品，且自身不得具有经济价值。 ”上述比较法上的立法例对于复制形式的规定，也同样适用于生成式人工智能场景下数据训练中的临时复制，因为其作为不可避免的技术组成部分，同样缺乏独立的经济价值。

脱离了现实土壤而进行权利效力范围的划定，终会不断衍生出新的问题。权利功能的合理定位无法脱离适宜权利生存的环境。上文对于市场“传播性”、复制行为“固定性”的分析，均围绕着复制权的初始诞生功能展开。以固定性、传播性作为复制权的构成要件正是对复制权初始功能的提炼，因而本文主张以“固定性+传播性”的构成要件重新定位复制权的功能，也就是复制权所控制的复制行为，应当同时具备“固定性”及“传播性”。面对突破性、颠覆性的技术变革，所引发的问题可能并非源于权利限制的不足，而只是因为我们并未从根本上理解权利。所以，真正重要的是正确看待权利、回归权利法的思维。

二、现实路径：回归复制权本源及工具论视角

延续上文论证，当转换到生成式人工智能场景时，面临两种现实路径：一是修改著作权法的立法论路径，二是通过司法在个案中进行裁判的解释论路径。本文主张，现阶段通过司法在个案中进行解释是更为妥当的办法。生成式人工智能还处于发展中，数据训练中复制、存储作品的方式或许还会更新迭代。同时，生成式人工智能技术当前还很不成熟，还需要配套性规则对接复制权重塑后的侵权判断标准，并不适合立法立即作出回应。更重要的是，人工智能是各国抢占的技术高地，相关纠纷中可能蕴含着政治博弈、价值冲突、利益分配等复杂因素，但由于司法具有将一般问题转化为个别问题、把价值问题转化为技术问题等方法，这些可能给国家或社会带来巨大冲击的矛盾最终可被审判所中和、吸收或者消解。因此本文选择解释论的路径，依据此种路径阐述重塑复制权下如何合法化生成式人工智能数据训练中的复制行为。

（一）

回归本源的解释论视角