正文
北京互联网法院经审理认为,原告主张已经对案涉数据进行了去标识化处理,案涉数据无法识别到被采集者个人,即仅拥有案涉数据难以对被采集人个人造成实际损害。在无相反证据的情况下,可以认定原告收集语音数据的行为符合法律规定;原告提交的《数据知识产权登记证》,能够证明涉数据集系由原告收集且持有。被告作为一家提供数据存储、标注、训练服务的科技公司,直接将案涉数据集aidatatang200zh作为其官网数据产品的服务内容向网络用户披露,并提供下载链接供用户使用,其上述行为主观上存在过错,应当承担相应的法律责任。北京互联网法院于2023年12月29日作出判决:被告赔偿原告经济损失10万元、合理维权支出2300元;驳回原告其他诉讼请求。
宣判后,被告提出上诉,北京知识产权法院于2024年6月28日作出终审判决:驳回上诉,维持原判。
厘定数据集合的定义是讨论问题的前提,但目前学界对数据集合并无统一定义。有学者认为,数据集合是指一定数量的数据条目按照特定目的汇集在一起而形成的数据集。数据集合倘若仅定义为“汇集”,那么数据集合与单个数据并无本质区别。所以,在数据集合的形成过程中,数据处理者需要进行加工或投入,使得数据集合具有新特性,体现更为丰富的价值。据此,数据集合是指数据经过数据处理者的收集、分析而聚合起来并含有新的特性,在聚合过程中经过处理数据的价值也变得更加丰富。司法实践中,绝大部分数据集合纠纷发生在商事主体之间,对数据集合财产权益的司法保护主要存在三种路径。
《著作权法》第15条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”依法条规定,数据可以作为汇编作品进行保护。而企业持有的数据形式一般为数据集合,其与汇编作品形式上相似,即符合汇编作品“集合性”的特点。如果在形成数据集合的过程中,对数据的选择或编排能够体现“独创性”,则数据集合享有类似汇编作品的著作权。
与此同时,汇编作品所要求的“独创性”即是该保护路径的痛点。汇编作品的“独创性”反映在对作品、数据或者其他信息的选择或者编排上,数据集合能否达到“独创性”标准从而被认定为汇编作品是实践中考虑的前置问题。判断一个数据集合是否达到汇编作品的保护标准具有主观性和不确定性,这给予了法官较大的裁量空间。即便构成汇编作品,《著作权法》保护的也只是数据集合的编排和结构,并不保护数据集合内容本身。但数据集合的价值恰恰体现在其内容上,在选择或编排上的创新程度有限。所以汇编作品保护路径并不符合现实需求,治标不治本。
适用《反不正当竞争法》来解决数据财产权益纠纷的路径是数据保护立法缺失背景下的产物,通常援引《反不正当竞争法》第2条作为裁判依据,其以侵权救济方式间接地实现对于企业数据权益的保护。该路径亦为实践中常见的规制方法,主流意见虽然对于数据保护的具体内容存在争议,但不质疑最低限度保护的必要性。该保护路径在一定程度上弥补了数据保护立法的空缺,维护了数据持有者的合法权益。《反不正当竞争法》保护路径的审判思路如下:首先,确定原告是否合法享有该集合的数据权益。对此通常考虑以下因素:数据持有人对数据的加工处理等形成过程是否投入相应的人力、物力,能否为持有人带来商业价值;数据产生或采集的合法性,如涉及个人信息的数据,是否获得用户授权。其次,判断当事人之间是否具有竞争关系,确认被诉行为对原告的数据权益实有损害。我国《反不正当竞争法》规定,不正当竞争行为是指扰乱市场竞争秩序、损害其他经营者或者消费者的合法权益的行为。司法实践中,法院对竞争关系的认定标准已不再局限于传统的“同业竞争者”。在“腾讯诉搜道案”中,一审法院认为,经营者的生产经营活动只要违反了法律和商业道德、扰乱了市场竞争秩序,即具有了不正当性。但实践中认定竞争关系依旧为适用《反不正当竞争法》的前置条件。最后,分析被诉行为是否具有不正当性,主要分析被诉行为是否违反诚实信用原则或商业道德,并经常涉及当事人间的利益平衡。常见不正当性的被诉行为,例如,违反“爬虫协议”爬取与利用,超出约定范围访问与利用,以获得用户同意之名获取与利用,以及以其他方式获取数据与利用。
与此同时,《反不正当竞争法》保护路径具有“过渡”性质,在相关立法尚未出台的背景下,该路径的出现虽然值得肯定,但并非数据保护的长久之计。第一,《反不正当竞争法》保护范围有限。适用《反不正当竞争法》调整的前提为当事人之间具有竞争关系,虽然我国已将“不正当竞争行为”从传统的狭义竞争关系扩张为广义的竞争关系,但竞争关系的前置条件在绝大部分类似案件的判定中仍然存在。换言之,无竞争关系的主体对某企业数据或数据集合实施的侵权行为并不受《反不正当竞争法》规制。而近些年,无竞争关系的主体所实施的侵权行为数量不断增多。第二,“一般条款”具有滥用风险。一般条款具有高度抽象性,就《反不正当竞争法》而言,其一般条款高度概括了已类型化不正当竞争行为的共有特征,亦是判别未类型化的不正当竞争行为的原则性条款。
在我国法律体系中,商业秘密被纳入知识产权保护客体范畴,但其概念规定于《反不正当竞争法》中,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。据此可知,商业秘密的法定构成要件:不为公众所知悉,即秘密性;具有商业价值,即价值性;采取了相应的保密措施,即保密性。数据只要符合上述构成要件,即可纳入商业秘密的保护范畴。2020年出台的《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》(以下简称《侵犯商业秘密规定》)第1条亦确认了这一点,而数据集合能否落入商业秘密客体的范围,却无相关规定。对于该问题,有学者认为,数据集合是否落入商业秘密客体的范围与数据条目的内容有直接关系,如果数据条目是《侵犯商业秘密规定》所称的“技术信息”或“经营信息”,由此构成的数据集合即可纳入商业秘密保护范围。实践中,企业所持有的绝大部分数据属于“技术信息”或“营业信息”,因此,绝大多数数据集合都可适用商业秘密保护路径。