经济学家看「数据」,何谓数据财产时代?

「数据是一切的起点,华夏又是数据大国,这使得数据运作在华夏变得非常重要。」在昨日举行的2021BAAI智源大会首日全体大会上,清华大学国家金融研究院院长朱民发表了题为《数据财产时代》的主题演讲,剖析了数据的经济学属性和财产特性,阐释了数据财产化的意义和必要性,解读了数据财产化转型将面临的挑战和应对策略。本文整理了朱民博士演讲的部分内容,并在文末附有相关演讲资料。整理报道 | 齐健数据在今天的社会中无处不在,随着数据范围的扩大,数据利用的加深,人们开始愈发重视数据的经济学特征。数据的虚拟特性,使其可重复利用,且转移成

图片

「数据是一切的起点,华夏又是数据大国,这使得数据运作在华夏变得非常重要。」在昨日举行的2021BAAI智源大会首日全体大会上,清华大学国家金融研究院院长朱民发表了题为《数据财产时代》的主题演讲,剖析了数据的经济学属性和财产特性,阐释了数据财产化的意义和必要性,解读了数据财产化转型将面临的挑战和应对策略。

本文整理了朱民博士演讲的部分内容,并在文末附有相关演讲资料。

整理报道 | 齐健数据在今天的社会中无处不在,随着数据范围的扩大,数据利用的加深,人们开始愈发重视数据的经济学特征。数据的虚拟特性,使其可重复利用,且转移成本为零;数据有高昂的固定成本,且复制成本几乎为零;数据可以同享,即具有非竞争性和非排他性。这三个特征,在经济学意义上为数据创造了很大的想象空间。IDC对寰球数据范围进行的预测显示,到2025年,寰球数据可达175ZB(十万亿亿字节),其中有超过一半(90ZB)来自物联网设备,80%的数据是非结构化的,数据交互用户则将从2018年的50亿上涨到60亿。今天的数据生产速度飞快,范围庞大,数据被机器利用的频率在不断增长。同时数据也使机器更加智能,各种利用都是以数据为起点的,智能化的系统将能够处理更多的数据,所以在智能化时代中数据将优先于利用,走得更快一点。数据是一切的起点,华夏又是数据大国,这使得数据运作在华夏变得非常重要。华夏的数据范围增速飞快。从中美数据比较来看,2018年,华夏数据产量总范围为2.76ZB,远不及美国的6.9ZB。然而到2025年华夏数据产量范围将达到48.6,放大17倍有余,达到美国的1.5倍。华夏的人口、设备量巨大,随之而来的是数据的生产、迭代速度飞快。在今天,华夏是数据大国,未来将是更大的数据大国。图片人工智能是与人类认知平行的机器认知。以数据为基础的机器认知正逐步成为人类认知进展的平行线,人工智能扩大了知识的绝对空间。同时,基于人工智能,数据不仅可以作为知识的载体,还与知识呈一体两面的关系,数据的流利就是知识的流利。而随着大数据和人工智能的快速进展,社会正在离开信息时代,走向智能时代。今天的数据不仅为科学提供创新,也能直接创造财富,数据在活动、运行的过程中,打消了庞大的经济范围。麦肯锡在2016年曾对寰球范围内数据与GDP的关系做出分析,在2005年到2014年期间,跨境数据活动使寰球GDP增长了约3%,数据活动所打消的附加值约为2.3万亿美元。买卖、移民、直接投资等一切贸易行为都与数据相连,最新的统计数据表明,欧盟地区8%的GDP是从数据中打消的。图片围绕数据打消的经济范围使人们愈发认识到,数据不只是资材,更是财产。当数据以公共资材的形态出现时,就很容易被滥用,以畜牧业为例,公共牧场很容易出现过度放牧的课题,因为没有管理,导致牛羊过度破坏牧场资材,最后势必导致生态恶化,破坏环境。因此,在市场经济准则下,要更好地满足数据技术对数据范围、维度、密度的要求,就必须把数据从「资材」变成「财产」,从而使其承担起应有的经济学功能,推动智能社会更好地运转。

 一 

数据资材到数据财产对转型

数据财产的概念是由信息资材和数据资材两个概念衍生而来的。数据财产一词诞生于上世纪七十年代,最初被认为是可持有的政府债券、公司债券和实物债券等财产。2011年的世界经济论坛,首次提出了数据成为新的经济「财产类别」。数据的基本特征是质量参差不齐、收集目的不同、非标准化、非结构化和相互隔离。数据有很强的外部依赖性,时效性、利用场景、利用算法、网络效应,这些都会决定数据的结构,数据的存量和数据的代价。数据的生成性是数据财产化的重要特征,数据本身并无代价,只有在被利用时,数据才打消代价。作为「财产」的数据有着一系列独有的特征,包括可买卖的财产特点;资材丰富、更新频繁、类别多样等信息代价;准公共物品的有限非排他性和非竞争性;可以流利利用的外部性;数据持续打消原始和衍生数据,不断创造新代价的自然增值属性;数据从打消开始就具备多方面满足人类生存和进展的多维性;零成本无限同享,且集合利用代价高。数据财产化要面临诸多挑战。首先是数据的产权模糊,数据具有可复制性,在今天的互联网中普遍奉行「谁采集谁拥有」的潜规则。由此,侵犯隐衷、数据泄露等课题比比皆是。当消费者进行网购时,消费者的数据要流经支付平台、银行、购物平台、商家等多个渠道,那么谁是数据最后的拥有者,这是一个很值得讨论的法律课题。由数据产权课题也引申出了数据的隐衷和平安课题,需要从社会与行业层面、企业层面、管理层面、技术层面等多方面共同解决。而针对所有权、隐衷与平安方面的考虑也导致了数据的开放与流利困难,数据不流利就会形成孤岛,孤岛就无法达到数据需求的范围和密度,数据的有效性就会大打折扣。此外,数据的定价和估值相对困难,数据的非竞争性和无限同享特性,使数据的潜在利用代价很大,数据具有很长的长尾代价链,代价链的各个环节需求不同,可以从数据中挖掘到代价也各有不同,这就使得数据代价具有很大的不确定性。因此数据财产需要建立动态的定价机制。数据财产化需要从多个维度实现:第一,解决隐衷平安计算方面的技术课题。通过多方平安计算MPC/同态加密、联邦学习/FDL和平安筛箱计算/TEE等技术手段维持数据的隐衷平安。图片第二,建立买卖机制。数据买卖过程中最大的课题在于数据权属难以界定。今天的法律对数据所有权的界定是模糊的,这直接导致了数据买卖困难,而数据的可复制性又使得数据所有权无需买卖。在这种情况下,要完成数据买卖,并满足多方利益需求,就要对数据的所有权、利用权、经营权和分配权进行分离。以数据所有权在权属分配方面,华夏过去的土地所有制改革经验十分值得借鉴,土地承包制度把土地的所有权、利用权、经营权和分配权一步步分离开,在随后的生产中打消了重大社会效益和经济效益。如果数据也能够在分离的基础上,明确利用权的归属、经营权的归属和分配权的归属,并由此建立生态,则可以有效加速数据财产化,提高数据利用的效率图片第三,数据财产金融化,即为数据赋予代价。数据在利用之前,需要先进行场景拆分、清洗、标注等一系列工作,因此数据的生产成本很高。而数据的代价链非常长,且随着数据被反复利用,不断集成,其本身的代价也会持续增大,数据的代价是一个动态进展的过程。由此,数据财产的起点是高成本,终点是长期回报。数据代价很难用成本法来计算,而以收益法计算则要考虑权利金的节约、超额收益和增量收益等多重因素。以市场法估算数据代价需要每一个所有者、经营者、利用者和分配者都在其中公平地分享的一个权重,共同投资数据,共同分享长期收益。图片第四,建立数据财产等商业模式。目前来看,数据财产有三种可行的商业模式数据平台买卖模式、数据银行模式和数据信任模式。目前,数据平台买卖模式在贵阳、上海等数据生态活跃地区,已经由政府主导建立了一些平台,数据平台通过第三方和政府资质完成禁锢与加密,较好地解决了数据互信、数据维持和数据供需的主要矛盾,且有助于大量行业通过平台沉淀形成数据标签与数据产品。数据银行的理念则是将数据存储在像银行一样的机构中,并由「银行」对数据进行加工、隐衷平安处理,以维持用户部分数据的所有权、知情权、隐衷权和收益权为核心,建立部分大数据财产的管理与运营综合服务系统,包括数据确权、汇聚、管理、买卖与增值服务等功能。数据信任是业内热议的全新数据商业理念,数据财产的所有、利用、收益等权属的分离与信任财产权属的复合式安排具有充分的契合性,数据财产成为信任财产在权利内容与制度安排上具有合理性和可操作性,各项权能安排可以通过信任财产制度得以有效设计和落实,数据财产成为信任财产后,可以满足数据财产的商业和业务逻辑需要。图片

二 

数据财产化正在寰球加速推动

目前,寰球的数据活动禁锢主要以鼓励国内数据同享,约束跨境数据活动为框架。在数据的内部同享方面,2020年欧盟的《数据治理法案》引入了「数据利他主义」,倡议部分、企业出于公益目的,自愿免费提供数据,并通过「数据利他机构」等设立推动数据同享。华夏在2020年推出的《数据平安法(草案)》中要求国家制定政务数据开放目录,构建统一规范、互联互通、平安可控的政务数据开放平台,推动政务数据开放利用而在国家之间,由于国家平安、国家间法律冲突等课题,各国尚未就数据活动达成一致。在立法取向上,美国强调跨境数据流利代价,欧盟则倾向于维持部分权利。以2012年APEC正式启动的跨境隐衷规则体系(CBPR)为例。在数据活动禁锢框架中提出了九项部分数据维持基本准则,包括:防止损害、通知准则、收集限制、部分信息利用准则、选择准则、维持部分信息完整、平安维持准则、访问和更正准则以及责任准则。在九项基本准则之上,APEC设立了隐衷执法机构、问责代理机构进行禁锢,并接受成员国企业申请隐衷维持认证。图片华夏经济正在全面走向数字经济,经济的驱动力正在发生着根本的变化。2020年的疫情提出了无接触的概念,也拉动了华夏的数字经济转型。在疫情以前,华夏经济是以地产、能源和传统基建驱动的资材型经济。疫情后,华夏的经济的驱动力开始逐渐向以数字经济和新基建为主的数据驱动过度,并逐步开启了新的无接触经济,并以自主创新的形式在寰球代价链中重新定位。数据财产化的关键在于部分与企业数据利用的平衡,在部分端,主体过于分散、权属复杂、数据代价参差、利用难以追溯、部分意识薄弱等特性,导致部分端数据代价真空。在企业端则会出现,超大型企业数据的马太效应、商业化驱动这个信息的茧房、数据记录与边界等课题。在这个过程中,政府可以起到非常重要的作用,包括明确部分数据信息的利用边界、企业数据行为管控、政府数据开放与流利、商业繁荣与部分维持等。图片华夏要在数据技术和商业模式方面走在世界前沿,就必须要抓紧构建数据财打消态。进展计算技术的内生平安性和向善性;定义所有权,以及所有权、利用权、经营权和分配权的分离;平衡维持隐衷和同享利用,数据不动,数据代价活动;建立市场激励机制和分配函数;完善法律框架和禁锢框架;明确政府的作用和地位;协调寰球数字财产治理机制:禁锢和法律,活动和买卖。世界正在离开信息时代进入智能时代。数据、算力和算法都在加速进展,整个物理世界和经济、社会生活都正在被数字化,数据财产化将是下一个颠覆世界和推动时代进展的里程碑。华夏已经是世界的数据大国,推动数据财产化对华夏科技创新、经济增长和社会进展意义重大。迎接挑战,继续改革开放,全面推进数据财产化,助力华夏经济走向高收入进展阶段,改变华夏经济进展的历史轨迹。下附朱民博士演讲PPT供参考。图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片

原创文章,作者:机器之能,如若转载,请注明出处:https://www.iaiol.com/news/jing-ji-xue-jia-kan-shu-ju-he-wei-shu-ju-cai-chan-shi-dai/

(0)
上一篇 2021年 6月 1日 下午2:47
下一篇 2021年 6月 8日 下午2:04

相关推荐

  • 墨芯首席科学家严恩勖:为什么说茂密化是AI计较的将来

    主讲人:严恩勖墨芯人工智能联合创始人 & 首席科学家卡内基梅隆大学 机器学习博士神经网络动态茂密算法发明者视频简介:10年前,AI计较优化大多提防在优化算法的计较复杂度上,近年来随着AI产业化,AI计较优化更多注重在硬件的算力提拔上。当前,硬件所能带来的算力提拔已贴近限度,AI优化计较的将来将是算法与硬件架构的共同优化,以及建立相应的软件生态。茂密化计较,带来数量级的算力提拔,将成为将来AI计较优化的领航者。视频内容:

    2022年 7月 18日
  • 阿里 BladeDISC 深度进修编译器正式开源

    作者:朱凯 – 机器进修PAI团队 随着深度进修的不断发展,AI模型结构在快速演化,底层算计硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对算计框架的持续迭代。深度编译器就成了应对以上课题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化本能的人力开发成本,进一步压榨硬件本能空间。阿里云机器进修PAI开源了业内较早投入实际业务使用的静态shape深度进修编译器 BladeDISC,本文将详解 BladeDISC的设计原理和使用。BladeD

    2022年 3月 30日
  • 用深度进修解决游览推销员成绩,研究者走到哪一步了?

    最近,针对游览推销员等拉拢优化成绩开发神经网络驱动的求解器引起了学术界的极大兴趣。这篇博文介绍了一个神经拉拢优化步骤,将几个最近提出的模型架构和进修范式统一到一个框架中。透过这一系列步骤,作者分析了深度进修在路由成绩方面的最新进展,并提供了新的方向来启发今后的研究,以创造实际的价值。

    2022年 4月 6日
  • 《几许深度进修》作者授课,2022年GDL100课程上线

    今年的 GDL100 包含通例课程、辅导课和专题研讨课,深入讲解了几许深度进修的基本概念和重要问题。

    2022年 7月 29日
  • 刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

    baidu ERNIE 3.0 不仅一举刷新 54 个华文 NLP 任意基准,而且进一步挖掘大规模预训练模型的潜力,首次在百亿级预训练模型中引入大规模学问图谱。

    2021年 7月 6日
  • 又一全新汽车品牌来了!瞄上「安康调理」场景,已获东风、长江等投资

    作者 / 曹锦10月30日,前大众团体高管苏伟铭的创业项目,得到进一步揭晓。由其担任创始人兼董事长的电动汽车品牌——BeyonCa正式亮相,同时还展示了代表品牌定位的概念车Gran Turismo Opus 1(GT Opus 1)。BeyonCa计划于明年春天宣布品牌中文名,第一辆量产车型将于2024年下线。大家对于BeyonCa的最初认知,无疑就是其核心人物苏伟铭。他曾在大众汽车任职16年,在2021年离职时,他位居大众汽车团体执行副总裁,也是团体内职位最高的华裔高管;此后,苏伟铭也曾担任雷诺中国CEO,而他创

    2022年 10月 31日
  • 硬科技起飞,这家成立仅三年的AI钻研院已颇具国际风范

    摘要:「我认为历史上多数突破性钻研成果的出现都是偶然事件,而钻研机构所有努力都是为了提升这类偶然事件发生的概率。」张宏江说道。他所牵头的「革新型钻研院」,即是一种积极探索,短短3年已展现一派生机。

    2022年 1月 11日
  • 目睹太多读博惨案之后,清华姚班助理老师写了个读博决策树

    读博之前请三思。对于部分同窗来说,结业当前读博是顺理成章的人生下一步。但在收获知识、荣誉的同时,你大概也要付出很大代价。最近,清华大学姚班助理老师张焕晨的一篇读博劝退文就在知乎上引起了热议。在文章中,他详细列举了读博之前需要三思的一些成绩,并用决策树的方式呈现了出来。在读完文章后,有人认为焕晨老师把读博之路描写得太痛苦了,劝退之味太浓。但焕晨老师表示,他的本意并非劝退,「故意把话说重是为了让各人认真思考」。他看到的现状是:良多特出的同窗都不在「我适不得当读博」这个重要成绩上进行过认真的思考,由此造成了良多「惨案」

    2021年 6月 24日
  • 「讹诈」制作业

    搜集犯罪分子将注意力从消费者转移到了更大更肥的是鱼上——有钱、缺人、承受迅速恢复产能的巨大压力的制作业公司。然而,许多制作商都不准备好与世界上最致命的恶意软件作斗争,即使遭受进犯,要么轻描淡写,要么讳莫如深。尽管讹诈软件通常会带来巨大的成本,浪费时间和资源,给公司的声誉和品牌带来巨大的危害,并且会影响整个行业的看法,但是,随着制作商向产业4.0过渡,面对搜集威胁,他们比其他行业更准备不足。比如,只有不到三分之二的制作商拥有搜集宁静打算,但打算位于部门响应打算最底层。越来越多的制作业企业也没

    2021年 4月 8日
  • 两款量产主动驾驭重卡登台WAIC 嬴彻科技全栈自研面向量产

    在主题为“智联世界,众智成城”的2021世界人工智能大会上,嬴彻科技展现了两款主动驾驭重卡的量产车型。这两款车型分别是与东风商用车、中国重汽联合开发,搭载嬴彻轩辕主动驾驭系统,是全球最早的量产型主动驾驭重卡。嬴彻科技同台展现了其全栈自研主动驾驭技能的一系列最新成果。 两款主动驾驭重卡登台WAIC 嬴彻首度展出和东风商用车、中国重汽分别联合开发的两款主动驾驭量产车型。2019年嬴彻启动与OEM联合开发主动驾驭重卡,两年来与产业伙伴紧密合作,遵守严谨的车辆正向开发流程,在主动

    2021年 7月 9日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注