姚前:为什么可以将数据托管在Web3平台?
来源: 姚前,中国金融杂志
在数字经济时代,数据已成为新型生产要素,是推动经济转型升级的基础性、战略性资源。将数据转变为数据资产,使其有序流转并合规使用,是发展数字经济的重要课题。近年来,我国先后颁布施行《网络安全法》《数据安全法》《个人信息保护法》等相关法律法规,初步构建了数据法制保障体系。2022年12月2日,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,提出构建数据要素产权制度、流通交易制度、收益分配制度和治理制度等20条政策举措。上述纲领性文件对于探索数据确权、定价、流通、交易、使用、分配、治理的具体实施方案具有重要的指导意义。
数据权益分配面临的困局
作为全新的生产要素,如何对数据进行定价和收益分配,吸引了许多研究者和业内人士的关注。2022年2月,图灵奖得主、中国科学院院士姚期智先生发布数据要素定价算法及要素收益分配平台。他认为,数据定价算法是一项非常新颖的交叉学科,涉及经济学、计算科学、人工智能,需要具备信息经济学、博弈论以及计算经济学等领域的理论基础。其中,信息经济学研究信息在经济活动中产生的价值和作用;博弈论中的合作博弈理论可以提供数据多方建模的理论基础;计算经济学涉及数据要素的联合建模、算力成本计算。姚期智先生的研究成果显示,可以根据博弈论的合作博弈理论,确立不同的数据对于决策模型的贡献度,贡献度越大的数据要素越具有价值。通过经济主体功效函数与决策模型贡献度的耦合,我们就可以对不同数据要素起到的经济价值进行合理公平的定量评估,从而对数据要素进行定价和收益分配。这就是数据要素定价的机理,在实践中则需要发挥市场机制的作用,实现数据资源的有效定价和合理配置。为此,理顺各方关系至关重要。
数据相关方可分为两个层次:一个层次是与数据生产消费直接相关的数据主体、数据处理者和数据使用者;另一个层次则是与数据生产消费间接相关的监管机构、国家以及国际组织。与数据生产消费活动直接相关的业务场景是:数据主体产生原始数据,通常包括识别客户(KYC)数据、交易明细数据等;数据处理者采集并控制原始数据,通过加工形成数据产品和服务,如客户画像、统计分析等;数据使用者从数据处理者获取数据产品和服务,用于包括营销推广、识别风险等在内的商业目的。与数据生产消费活动间接相关的业务场景是:监管机构层面按职责对行业进行监管,比如反洗钱、反垄断等;国家层面对数据治理进行立法,比如网络安全法、数据安全法、个人信息保护法等,并对数据跨境流动进行管控;国际组织推动全球数据标准制定,比如数据报文标准ISO 8583、ISO 20022等。
目前数据相关方的权益分配存在诸多不合理现象,主要体现为数据处理者利用技术优势和应用场景优势垄断数据权益。数据使用者通过数据处理者获取数据产品和服务并支付对价;数据处理者垄断数据权益,导致数据主体无法获得转移原始数据带来的收益,国家也无法获取相应的数字税,监管机构也因“手中无数”而面临监管和执法困难。此外,数据处理者为了维持数据收益,往往会利用自身科技优势自建标准,形成数据孤岛和数据垄断。
数据托管基础设施重塑数据权益分配格局
在传统方式中,数据处理者包揽了数据存储和数据使用;而在数据托管新模式下,数据的存储、使用、管理相互分离,由数据托管者为各方提供公共可信的数据存储和托管服务。数据存储工作由专业的数据托管机构承担,早期可从高价值数据和数据库日志着手,以后逐步过渡到全量数据。数据处理者在监管条件下采集和加工数据,并向消费者提供数据产品和服务,加工后的数据也要交由数据托管机构统一存储。数据托管还支持监管机构和国家有关部门开展防止数据滥用、监控数据跨境流动、执法取证、征收数字税等方面的工作。
数据托管新型基础设施改变了以数据控制者为核心的传统模式,建立以数据为中心的新型生产关系,从根本上改变了数据权益分配格局,有助于在数据消费者和数据处理者之间建立公平的定价机制(见图1)。
从数据处理和服务流程来看:数据主体将原始数据托管给数据托管者;数据处理者取得数据,加工数据,加工后的数据产品也需要被托管;数据托管者对数据处理者的数据使用和服务过程进行监督;数据处理者可以按照市场化的方式为数据使用者提供数据产品和服务。
从数据权益分配流程来看:数据使用者消费数据产品和服务并支付对价给数据托管者;数据托管者按照规则将原始数据权益分配给数据主体,将增值数据权益分配给数据处理者;数据托管者按照监管要求,报送监管数据并配合执法取证;数据托管者按照国家要求缴纳数字税;数据托管者按照通行标准进行数据治理。
数据托管的国际实践
近年来,国际上在数据托管方面已经展开了探索,并在某些领域取得了初步成效,其中版权托管方面的实践具有一定的参考价值。
为了实现知识传播与版权保护两者的平衡,全球非营利组织知识共享(Creative Commons)推出了许可证模式,试图以一种自由、简单、标准化的版权授予方式,在允许他人复制、分发和使用知识作品的同时又确保版权不受侵害。许可证类型分为六种。其中,最宽松的许可证允许再使用者只要注明出处便可以通过任何媒介分发、改编和重构原著,并且允许用于商业目的;最严格的许可证则仅允许再使用者以未经改编的形式复制和分发作品且只能用于非商业目的并保留原创者署名。目前,知识共享已经汇集了各类支持知识开放共享的教育工作者、艺术家、技术人员、法律专家、社会活动家及相关国际团体。他们将作品版权托管至支持知识共享许可证的内容平台,以许可证的形式允许再使用者按照规定分发、重新混合、改编和重建原著。目前,Wikipedia、Google、Bing、Flickr、YouTube等互联网平台均集成了知识共享的许可证,超过14亿件作品被托管至这些平台,以许可证的形式开放共享,其中包含文学艺术、开放教育、科学研究等领域的视频或音频作品。
基于许可证的作品托管及分享模式,较为有效地解决了创作者权利保护与知识开放共享之间的矛盾,本文提出的数据托管思路也与之不谋而合。但值得担忧的是,由于作品的托管机构中包括了Google、YouTube这类商业平台,其商业逐利性很可能最终会偏离知识开放共享的初衷。有鉴于此,为了避免可能的商业利益冲突,数据托管的较好方案是:要么将数据托管在可信的非营利性公共机构,要么将数据托管在基于可信技术的Web3.0平台。
前一个思路已有相似案例。2001年成立的美国科学公共图书馆(Public Library of Science,PLOS)是一家非营利性机构,其宗旨就是促进全球科学期刊开放共享。20多年来,PLOS组织了许多有影响力的期刊开放共享。研究人员可在经过同行严格评审后在PLOS上在线公开出版其研究成果,且成果可不受限制地被免费获取。此外,PLOS还将与研究成果相关的基础数据托管存放在专用数据库,同研究文章一起发布,从而确保文章的数据可验证、可复制、可重用,此举有助于促进新的科学研究。总体而言,PLOS打造的交流平台堪称一个可信的数据托管基础设施。
后一个思路正在积极探索中。区块链技术在版权确权和维权方面具有独特优势,它可以不依赖特定机构又能有效规避商业利益与公共服务的冲突。目前知识共享正在积极研究如何将知识许可证模式与Web3.0技术融合起来,以便更好地实现知识的自由开放共享。
结 语
数据托管机构作为所有数据主体的受托者,对数据资产进行集中托管,可以有效保证数据安全、数据可控且高效利用。就像前台的股票交易需要后台的股票登记存管一样,数据托管机构刚好承担了大数据交易所的后台基础设施角色,从而与大数据交易所一道,构成了完整的大数据基础设施体系。数据托管机构可以是由相关机构组建的数据托管行业联盟,推动数据共建共享;亦可利用区块链技术,基于联盟链或有管理的公链,实现数据的链上托管、确权、交易、流转与权益分配。哪种方式更好,有待在未来实践中进一步探索验证。