数据合理定价:利用数据资产图谱解析数据价值网络.docx
《数据合理定价:利用数据资产图谱解析数据价值网络.docx》由会员分享,可在线阅读,更多相关《数据合理定价:利用数据资产图谱解析数据价值网络.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据合理定价:利用数据资产图谱解析数据价值网络在中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见(以下简称“数据二十条”)指导下,我国正在快速建设数据要素市场。本文从“数据二十条”对数据收益的指导原则出发,基于公平性与有效性原则,构建数据定价与数据资产价值评估的理论基础,并以与央企、互联网集团和金融机构的合作为基础,开发相关计算技术。理论证明:在满足公平性与有效性原则的情形下,在任一经济活动中的参与贡献数据要素,存在一个唯一、公平有效的收益分配理论解。进一步,开发数据资产图谱技术,用以解析数据生产使用链条上下游数据的贡献度,并可不断自动化盘点数据在各项经济活动中的收益值,为数据资产
2、价值评估提供参数依据。一、问题的提出2022年12月,中共中央、国务院发布关于构建数据基础制度更好发挥数据要素作用的意见(以下简称“数据二十条”),这是关于数据要素市场全局发展的战略性指导意见。该意见确立了数据要素作为一个新的生产要素的重要战略地位,涵盖了相应制度安排和发展方向等具体内容。其中,数据定价及收益分配问题被认为是至关重要的一个环节。“数据二十条”明确提出:“建立体现效率、促进公平的数据要素收益分配制度”,并指出“健全数据要素由市场评价贡献、按贡献决定报酬机制。结合数据要素特征,优化分配结构,构建公平、高效、激励与规范相结合的数据价值分配机制”。同时,国家数据局的成立也将为数据要素市
3、场的制度建设提供有力基础保障。然而,目前数据定价和收益分配是亟需解决的难题。数字经济的发展需要核心技术为基础,在核心技术层面,应当进一步增加数据交易类技术、数据流通审计技术、数据建模与模型治理等底层技术的投入,并以这些底层技术“新基建”为引领,加快实现数据要素市场化配置、合理分配数据要素收益等。不论是市场参与者还是政策制定者都需要客观了解数据与场景、数据与数据之间的价值关系,从而形成与数据要素价值和贡献相适应的收入分配机制,进而驱动企业内部的独立核算、企业间的数据共享,形成数据要素市场。本文专注于从经济学与数据科学的交叉维度,讨论数据实际的经济价值并给出客观的计算方法。数据定价为什么难,本质上
4、是因为数据有不同于其他要素的特殊价值特征:也就是姚期智(2022)指出的特异性、协同性与无限可用性。首先,数据价值具有特异性特征:同一数据对于不同场景的价值是不同的,对于同一场景不同数据的可用性与价值也是不同的。例如:某种电力数据,可以应用在电力定价、调度优化等场景实现经济价值;也可以与金融场景结合对企业金融服务参与信用评价产生经济价值;还可以用于地区经济的统计分析、规划决策的模型中。可见,对于不同使用场景,同一个数据产生的贡献与经济价值是不同的。其次,数据价值具有协同性特征:在使用数据的时候经常会发现多种数据的组合对某个场景的应用产生超过单一数据生产价值的总和,这种“1+12”的现象也是数据
5、科学非常有魅力的地方。多维度的数据可以更精准地帮助分析、预测、决策等关键经济活动中的动作,不像传统要素一样,数据价值的加总不能是线性的简单相加。最后,数据价值具有无限可复用性:这也是数据要素具有的独特特征。不同于传统的生产要素,如土地(盖了房子就不能盖停车场,盖停车场就不能盖商城)同一时间单一使用场景的限制,数据可以在同一时间被不同主体调用参与多种经济活动(当然,在安全合规使用的前提下),在这个过程中数据产生了经济价值倍增的效应。因此,数据对不同场景的价值关系形成了一个客观的图谱,数据与数据之间的协同关系也形成了一个客观的图谱。数据参与到无限可复用的各种场景下形成了潜在数据价值的广阔图谱,数据
6、的价值本身形成了一个广阔而丰富的网络化图景,这也就是建设数据要素市场所追寻的星辰大海。如果能开发数据资产网络图谱相关理论和技术,就可以解决一系列关键问题:如交易中数据定价难的问题,数据资产入表的价值核算问题;数据收益分配的问题,大集团多主体数据交叉应用时如何合理分配权益激励使用问题;数据与场景的价值关系即供需关系的分析问题,基于供需关系的大量解析与积累就能解决数据交易使用撮合效率低的问题等等。在姚期智院士的指导下,交叉信息核心技术研究院团队与国家发展改革委价格监测中心紧密合作,为解决数据定价难、数据交易效率低提供了全新思路。二、数据要素定价体系构建(一)基于经济场景的数据定价理论基础目前国内外
7、对于数据定价与价值管理的研究仍旧处于初期,还未形成一套切实可用的体系。数据定价的研究容易陷入了一种“非对称性”陷阱,即将数据提供方和数据使用方处于“不对等” “非对称”的地位,这种设置就使得数据定价成为甲乙双方各执一词的讨价还价场景,容易陷入主观维度、主观指标的争执,失去了客观性的准绳。如何能建立客观的数据定价理论基础呢?实际上,中央文件已给出高瞻远瞩的指示。根据“数据要素二十条”的要求,公平性与有效性是数据价值分配机制的基础。首先,本文给数据定价问题一个更通用的设置:参与方可以是多方,大家使用数据共同完成某项经济活动。无论是数据的提供方还是数据的使用方,都将其定义为“数据协作方”,这样大家的
8、地位是平等的,形成了公平性的基础,问题的设置也形成了一个对称性问题。即使是买卖两方也符合这一更通用的设置,即存在两个数据协作方,一方提供的数据量必须不为零(卖方),另一方用在这项经济活动中的数据量可以为零(买方),两个数据协作方即对应传统概念中的“供需双方”。根据这两项原则,基于信息经济学、博弈论、计算经济学和计算复杂性等交叉学科理论,构建形成在某项经济场景中数据定价的理论基础:首先,利用信息经济学中信息价值的相关理论,建立各个业务场景中经济价值与数据应用之间的映射关系,从而将经济价值转化为对数据应用精度与风险的度量。在这一过程中需要将场景中数据使用者的价值度量,即经济学中应用的效用函数与数据
9、应用的决策过程耦合起来。因此,这是纯粹意义上数据的经济价值;在此基础之上,运用合作博弈的理论基础,对参与数据应用的所有数据都可以进行公平有效的价值分配,由此建立数据与某项经济活动的价值关联。这样,就可以建立某项数据与某项经济场景之间的定价理论。(二)数据要素价值实现路径与风险治理1.数据价值实现路径。数据要素的价值发挥,离不开业务场景,而通过各式各样的数据,结合数据模型,设定优化/预测等决策目标,搭建数据模型,进一步通过模型输出结果,提取出信息,实现对业务生产过程的决策辅助指导,这是数据发挥价值的实现路径。目前,数据价值实现的路径有些是模型化的(例如利用人工智能算法建模),有些是非模型化的(例
10、如通过商业智能展示和数据报表供决策人分析)。对于非模型化的应用场景,可以利用宏观的统计模型核算要素的投入产出以归因数据要素的经济贡献;对于模型化的数据应用场景,由于已经完成了可独立量化评估的数据贡献,可以用更精细化的方法进行计算,在一些场景里,我们已与行业专家定义了具体的效用函数,利用自动化程序计算各颗粒度的数据定价。我们在大型机构中发现约20%的数据使用场景已经是模型化的,其余是非模型化的。模型化数据应用场景随着人工智能的发展,尤其是现今大模型的飞速发展会呈显著上升趋势。因此,本文专门讨论一下模型的评估与治理。2.数据模型评估及其潜在风险控制。在数据模型使用过程中,需要充分考虑模型的评估以及
11、潜在风险控制。而数据作为模型的输入端,同样影响着模型的评估与潜在风险控制这两方面。数据模型的评估。数据进入生产后,依赖于模型结果,即当用算法建立模型后,使得数据进行自动化生产。比如,个人信用评估模型、个性化推荐模型等等,这些数据通过模型形成数据产品,再与人的决策和运营产生经济价值。而这些进入各个生产活动中的数据模型,也需要通过在各个场景进行评测,才能建立“数据经济价值”的映射关系。通常情况下,数据模型的精度越高,决策效率越高,产生的经济价值就会越大。因此,数据模型的精度与模型价值息息相关。随着数据的大规模应用,人工智能算法的不断演进,模型算法的评测和治理也成为重要的一个环节。模型评测的技术可以
12、揭示数据模型的价值与实际经济价值的关联关系,这对数据定价是一个重要的基础。数据模型的风险。与数据模型精度相对应的是模型的风险,也就是人工智能应用的风险。这些风险来源于以下方面:一是数据模型本身误差的风险,比如金融行业的产品定价模型、风控模型等都有可能产生误差,这些误差会直接导致业务损失。有些时候随着风险积累还会产生系统性风险,比如2008年全球金融危机的导火索就是金融衍生品的定价模型误差。对于模型误差带来的风险需要进行合理的评估和治理;二是模型的结果在应用中会产生虚假或错误信息。当前,人工智能模型合成的数据和信息有可能是错误或虚假的,但这种情况下人类无法辨别这类信息的虚实。因此,需要算法来监管
13、这些模型,避免产生虚假或错误信息的生成;三是人工智能模型有可能会产生歧视和不公平的结果,这种现象有可能是由数据本身自带的偏差造成,也有可能是算法设计存在缺陷。现实生活中常见的例子有价格歧视、大数据杀熟等,即平台算法有可能面对不同的人对于同样的产品展示不同的价格。金融领域也有可能出现放贷审批模型对不同的人群有所偏差,使得本应合格的申请人由于因为处于某个群体而遭到拒绝。监管模型、测试重要的公平性指标是减少这类问题的关键。以上是数据模型治理方面需要重点关注的方向,模型治理既是技术问题,又是制度问题。通过逐步推动人工智能模型治理的技术发展和制度安排,将更有助于利用数据资产构建智能化的人工智能模型,使得
14、各领域的数据集合于人工智能大模型,实现生产力的倍增。(三)数据资产总价值的评估数据资产评价与估值是数据资产运营的有效举措。通过对数据资产的管理、使用情况进行全面评估,运用科学的方法和适用的原则,以货币为计算权益的统一尺度,对在一定时点上的数据资产进行价值评估,从而实现以数据价值为导向的持续运营能力提升。目前全球对数据资产价值评估和数据资产定价都有一定的探索,但还未到成熟可全面推广应用的阶段,相关的理论、技术和模型等还有待进一步研究和开发。国家标准信息技术 大数据 数据资产价值评估(征求意见稿)中明确列举收益法、成本法、市场法等相关评估方法。同时,指出在对数据资产进行价值评估时,应分析数据资产的
15、基本属性和基本特征。基于评估资料选择适用的评估方法,对数据资产的价值进行评估。由于前文中提到的数据资产特殊性,数据资产与其他资产类别在估值定价方面存在相似的方法论,也有明显差异。对于金融资产或实物资产,其估值定价通常是通过未来现金流折现加总等传统方法计算。土地作为一种资产常常被用于与数据资产进行比较:在对土地进行估值时,从金融学的角度出发,土地本质为一种实物期权。这种实物期权只能在同一时间应用于一项特定的活动中,比如土地可以用于建造写字楼或停车场。建成写字楼后,可以通过出租办公室或出售写字楼获得现金流,而停车场则可以通过出租停车位获得现金流。因此,土地资产的估值取决于各项经济活动的市场价格,投
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 合理 定价 利用 资产 图谱 解析 价值 网络
限制150内