专栏名称: 软件定义世界(SDX)
软件定义世界, 数据驱动未来。
目录
相关文章推荐
大数据文摘  ·  26 天倒计时:OpenAI 即将关停 ... ·  18 小时前  
大数据文摘  ·  基础统计学:计算空难事件概率 ·  2 天前  
51好读  ›  专栏  ›  软件定义世界(SDX)

数据资源入表的理论溯源与研究路径

软件定义世界(SDX)  · 公众号  · 大数据  · 2025-06-17 06:00

正文

请到「今天看啥」查看全文


资料来源:根据现有文献手工整理。


3.数据资源相关概念界定和分类


许宪春等认为数据的时效性决定了数据的使用寿命长短不一,如果数据的时效性不足一年,应被视为中间投入,故把数据资产定义为拥有应用场景且在生产过程中被反复或连续使用一年以上的数据。把数据资产界定为:以电子化形式存在,由过去事项形成,预期能为组织带来经济利益且该经济利益可用货币计量,由组织合法拥有或控制的现时非货币性数据资源。认为能够确认为数据资产的数据资源应该在过去的交易中形成,同时明确企业能够控制,且该数据资源具有带来未来经济利益的潜力。本文所说的数据是指以电子或其他方式记录下来的原始数据;数据资源是指把原始数据进行一定程度的加工处理以后,现在或者将来具备经济价值的数据;数据资产是指满足资产定义和确认条件,能进行货币计量,能入表的数据资源。三者的关系详见图2。


图片

图2 原始数据、数据资源与数据资产的关系

资料来源:根据现有文献手工整理。


数据资源的分类可从多种维度进行,采取的分类标准和分类角度不同,分类的结果可能会有重合,但也会存在差异。根据数据权属不同,可以把数据资源分为三类,分别是企业数据资源,包括内部数据资源和外部数据资源;政府数据资源,包括政府业务和社情民情等多种公共数据;个人数据资源,包括个人用户自然生成的数据及其他多样化社交类数据。根据市场属性,数据资源又分为已市场化及未市场化的数据资源;基于数据来源,又可区分为交易性数据和自给性数据。本文依据《暂行规定》的适用范围,把数据资源分为两大类型,分别是《暂行规定》范围内和范围外的数据资源。其中,范围内的数据资源又包括企业按照企业会计准则相关规定确认为无形资产或存货等资产类别的数据资源,以及企业合法拥有或控制的、预期会给企业带来经济利益,但由于不满足企业会计准则相关资产确认条件而未确认为资产的数据资源,详见图3。


图片

图3 数据资源的分类

资料来源:根据现有文献手工整理


(二)数据资源演进阶段


基于技术进步、应用范围以及研究方法和研究重点的演变,本文把数据资源的发展历程分为早期、中期和现代三个阶段。


1.早期阶段(1970年至1990年)


由于计算机技术和数据处理能力有限,此阶段数据资源的发展和研究主要集中在数据的收集和存储方面,同时集中在企业内部的关系数据库中,用于业务处理和管理。这一阶段的代表研究是关系数据库模型和实体关系模型(ERM),关系数据库模型的提出,奠定了数据资源管理的理论基础。关系数据库模型包括三个基本要素:数据是以表(table)的形式组织的,关系数据库中的数据被组织成一个个表,每个表包含了若干行和若干列,每一行代表一个记录,每一列代表一个属性;数据的访问是无序的,关系数据库中的数据是无序存储的,用户可以通过指定条件来检索数据,而不需要关心数据的物理存储位置;数据之间的关系是通过关键点(key)建立的,在关系数据库中,不同表之间的关系是通过关键点来建立的,一个表中的某一列可以作为另一个表的关键点,从而实现表与表之间的关联。实体关系模型(ERM),将数据表示为实体(entity)和实体之间的关系(relationship)。这种模型简洁清晰,易于理解和应用,成为数据库设计和数据建模的重要工具,为后续数据仓库理论的发展奠定了基础。


2.中期阶段(1990年至2000年)


随着数据量的增长和多样化的需求, 数据仓库和数据挖掘等技术得到了发展,数据资源管理逐渐从单一的数据库管理转向了更加综合和多维的数据管理。这一阶段的代表研究是数据仓库理论,Inmon(1995)探讨了数据仓库的概念、设计和实施,强调了数据仓库在组织中的重要性以及如何利用数据仓库进行数据分析和决策支持。数据仓库是企业的中心数据存储库,用于集成各种数据源,并支持决策支持系统(DSS)和业务智能(BI)应用。Kimbal(1998)介绍了数据仓库生命周期的方法和工具,包括数据仓库的设计、开发和部署阶段,强调了数据仓库的可行性和实施方法。


3.现代阶段(2000年至今)


随着互联网和移动互联网的发展,大数据时代的到来,数据资源规模不断扩大,数据类型日益丰富,涌现出了大数据技术、云计算、人工智能等新兴技术和方法,数据资源管理面临着更多的挑战和机遇。从这一阶段开始,数据科学成为一门独立的学科,数据驱动决策对企业越来越重要,其中,数据架构是关键,包括数据湖、数据仓库、数据集成等。Lambda架构提出了大数据环境之下数据架构的解决方案,Spark分布式计算框架体现了大数据处理中的高效性和灵活性。数据科学在业务中的应用,包括数据挖掘、机器学习等技术的原理和实践,强调了数据挖掘在发现潜在信息和知识方面的重要性。


我国对数据资源的关注始于20世纪90年代末至21世纪初,政府部门、学术界、企业逐渐意识到数据资源对国家经济发展和社会进步的重要性,纷纷开展相关研究和实践,在政策层面提出了一些倡导,形成了一系列发展策略和规划。当前,我国的数据资源管理和利用水平不断提升,政府部门建立了一系列数据开放和交易平台,促进了数据资源的共享和应用。同时,企业和研究机构也在加大对数据资源的开发和创新,推动数字经济的蓬勃发展。


(三)数据资源相关的经济增长理论与微观机制


1.数据资源相关的经济增长理论


Farboodi & Veldkamp(2021)建立了一个类索洛增长框架的数据经济增长模型,讨论数据要素积累对经济的影响。该模型指出,数据积累在不同水平上会产生递减和递增的收益,形成“数据反馈循环”(data feedback loop),企业在利用数据进行预测时,能够生成更多的数据,这又进一步提高了生产力,形成正向循环。数据积累不足的企业或行业则可能会掉入“数据贫困陷阱”(data poverty trap),导致经济增长的不平衡,政府和企业应重视数据的积累和利用,以促进经济的可持续增长。Begenau et al.(2018)依据企业重复静态博弈模型研究指出,大型企业由于拥有更多的经济活动和更长的经营历史,能够产生和处理更多的数据,丰富的数据支持了更多的财务分析;而数据维度的多元化和数据分析技术的进步反过来使得投资者能够获取和处理更多的数据,有助于投资者据此做出高效、明智的决策,从而降低企业的资本成本,资本成本的降低又进一步促进了大型企业的扩张和成长。Ciuriak(2020)研究发现,在数据驱动经济中,数据资源的聚集容易导致大规模经济租金的产生,而经济租金的分配可能涉及不同国家之间、企业之间、企业与政府之间以及消费者与企业之间的利益博弈。因此,数据治理和管理对经济增长至关重要。


2.数据资源影响经济增长的微观机制


为了成功实施大数据项目,公司可能需要进行文化或结构上的调整,以支持数据驱动的决策过程。在所有组织层面上对数据战略的理解和接受程度至关重要,因为数据对客户关系加强、管理风险降低和运营效率提升具有重要影响。Huang & van Mieghem(2014)提出了一种新的库存管理模型,该模型利用网站或电子商务平台的点击数据来准确地预测产品需求,从而减少库存成本和提高产品可用性,并据此调整库存水平、优化库存管理。通过将数据作用于企业现有的服务和产品,能够帮助企业改善经营管理,优化业务流程,提高服务质量,降低整体成本。这些经济理论和机制表明,具有零边际成本、信息悖论和关联效应等特征的数据资源与其他要素资源充分融合,有利于促进经济的可持续增长,政府和企业应重视数据的积累、管理和利用,以便推动整个社会经济的跃升。


综上所述,数据资源应当被视为一种重要的资产,企业应当充分利用数据资源来推动创新,提升竞争力和增加生产力,并将其计入企业的资产负债表中,以反映其对企业价值的贡献。本文后续部分探讨的数据资源确认、计量和列报主要是针对《暂行规定》适用范围内的数据资源,且遵循数据资源入表“五大流程”的逻辑进行文献评述,详见图4。针对《暂行规定》范围外的数据资源,本文暂未进行讨论。


图片

图4 数据资源入表“五大流程”

资料来源:根据现有文献手工整理。


数据资源确认

0 3


数据资源能否成功计入资产负债表,不仅要求数据资源本身权属清晰,还要求特定主体具备一定程度的数据管理能力。本部分首先明确数据资源的确权问题,然后梳理数据资源的有效管理问题,在此基础上判断一项数据资源是否满足入表条件,能否确认为数据资产。


(一)数据资源确权


数据资源确权,就是以法律形式明确不同类型数据资源的产权属性,明确数据资源的产权属性有利于定分止争,规范数据秩序。近年来关于数据资源确权问题的国内外研究主要形成了基于数据生成理论的数据资源确权研究和基于数据来源理论的数据资源确权研究两大方向,同时也有一些学者基于科斯产权理论、数据流通理论、劳动赋权理论、权利束视角等对数据资源确权问题进行探讨。


1.基于数据生成理论的数据资源确权研究


数据时代的数据资源是被生产出来的,包括原始数据的生产和数据集的生产,并经过汇集处理后实现其分析价值。个人可能参与原始数据的生产过程,但数据生产的主体是数据采集设施设备运营者,个人只是数据描述的对象和源头,在数据上享有主体利益,但不能把个人数据归属于个人财产。熊巧琴和汤珂(2021)提出应当针对个人信息的隐私和风险级别赋予数据生产者(个人)不同级别的拒绝权、可携权、获取收益等数据控制权,赋予数据产品持有者(数据收集者、设备生产者等)有限制的占有权。但是该学说在很大程度上忽视了个人用户的贡献,过度偏向企业数据。数据资源赋权的逻辑起点应该考虑数据起源问题,个人用户的网络接入行为直接导致了数据的形成。


2.基于数据来源理论的数据资源确权研究


申卫星(2023)认为应根据数据来源判断数据权属,个人和企业对源发于自身的数据享有所有权,无论该数据最终由谁进行收集。在登记确权方面,可建立数据资产账户备案制度,借鉴专利的“申请、受理、初审、实质审查、授权”等步骤流程审查登记备案。Jones & Tonetti(2020)认为数据的广泛使用能够促进经济增长,但公司出于对创新的担忧,可能会选择囤积数据。这种局面不仅抑制了创新,还使得数据的社会价值未能最大化。主张将数据产权赋予消费者,既能激励他们主动分享数据,促进数据的流通和利用,还可以增强消费者的隐私保护。Janeček(2018)基于资源所有权的四要素,即对特定资源的控制、保护、评估和分配,对个人数据的所有权进行了探讨。作者强调对个人数据的全面控制意味着能够充分使用个人数据,即访问、存储、共享、出售、修改或处理这些数据;对个人数据的保护体现为能够将其他人排除在个人数据带来的收益之外;必须有可能将个人数据中的明显效用和透明价值体现为一种可交易、可控的和有保护价值的商品;个人数据的分配涉及“个人数据属于谁”的问题。


3.关于数据资源确权的其他理论和观点


曾经风靡一时的“科斯式”数据确权方式实际上讨论的是以界定财产权的方式解决个人信息的隐私问题。Lessig(2006)认为个人信息在数字时代应被视为一种财产,个体应有权决定其信息的使用方式,但同时也需要承担相应的责任,确保信息的安全和隐私,个人对其信息的控制权是实现信息财产权的核心,过度的控制可能会侵蚀公民自由。高富平(2019)基于数据流通理论认为个人数据和非个人数据流通的本质是数据的许可使用,建议采用“一对一”许可、“一对多”许可和相互许可三种数据社会化利用模式勾勒数据流通与确权形式。劳动赋权理论认为用户数据主要源自用户无意识的网络行为,单个用户数据只有在经过企业收集、加工、储存、分析、利用等劳动以后,才具备经济价值和社会价值,所以用户数据的财产权应归属于企业。王利明(2022)则认为以数据为载体的数据权益纷繁复杂又盘根错节,呈现出以所有权为主干,以他物权为分枝,在他物权之上再生分枝的网状结构,好比在数据之上长出了一束束的花朵,而这些花朵就是“权利束”。因此,有必要借鉴“权利束”理论对数据权益归属进行分析讨论。Saarikko et al.(2017)认为,在物联网时代,由产品、流程和服务相互连接形成的数据,一方面是根据使用者所采取的行动生成的,产品流程和服务的使用者应拥有该数据的掌控权;另一方面是产品制造商拥有的服务器和系统所生成、收集、分析和呈现的,数据所有权应该属于收集和分析数据的产品制造商。因此,不存在“一刀切”的通用方法,数据所有权的处理应根据不同行业、市场和地区来进行灵活判断。


本文认为,鉴于现阶段数据产权制度、数据权属分配规则等基础制度体系尚未健全,且学术界和司法判决对数据是否应当确权以及如何确权等问题众说纷纭,可暂时借鉴申卫星(2023)在数据来源者的所有权和数据处理者的用益权“两权分离”基础之上的“数据资源—数据集合—数据产品”三阶段确权思路,依据“数据二十条”关于数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架对数据资源进行确权。企业享有对特定数据资源的持有权意味着其能够自主管理数据,通常也能获得数据带来的经济利益。数据加工使用权可以再细分为数据加工权和数据使用权,判断数据加工使用权应当注意以下两个前提条件:其一,在获得数据加工使用权时,必须遵守相关法律规定和合同约定,确保数据的加工使用不损害公共利益、不威胁数据的安全,同时也不能侵犯数据来源者的合法权益。其二,对数据进行加工和使用之前亦应取得数据资源持有者的明确授权。数据产品经营权包括数据权利主体和数据权利客体,数据权利主体是数据处理者,数据权利客体是数据产品和数据服务。该权利的目的是保护权利主体的合法权益,确保其能够合理获得回报,以回应其在数据处理方面的投入。







请到「今天看啥」查看全文