大数据发展与数字经济.docx
在信息化开展历程中,数字化、网络化和智能化是三条并行不悖的 主线。数字化奠定基础,实现数据资源的获取和积累;网络化构建 平台,促进数据资源的流通和汇聚;智能化展现能力,通过多源数 据的融合分析呈现信息应用的类人智能,帮助人类更好地认知复杂事物和解决问题。信息化新阶段开启的另一个重要表征是信息技术 开始从助力经济开展的辅助工具向引领经济开展的核心引擎转变, 进而催生一种新的经济范式"数字经济。大数据的现状与趋势 全球范围内,研究开展大数据技术、运用大数据推动经济开展、完 善社会治理、提升政府服务和监管能力正成为趋势。大数据应用已有众多成功的大数据应用,但就其效果和深度而言, 当前大数据应用尚处于初级阶段,根据大数据分析预测未来、指导 实践的深层次应用将成为开展重点。按照数据开发应用深入程度的 不同,可将众多的大数据应用分为三个层次。第一层,描述性分析 应用,是指从大数据中总结、抽取相关的信息和知识,帮助人们分 析发生了什么,并呈现事物的开展历程。如美国的DOMO公司从 其企业客户的各个信息系统中抽取、整合数据,再以统计图表等可 视化形式,将数据蕴含的信息推送给不同岗位的业务人员和管理者,利于打通不同部门和系统的壁垒,促进数据流转,形成覆盖全面的大数据资源,为大数据分析应用奠定基础。大数据资源,为大数据分析应用奠定基础。第三,安全隐患增多。近年来,数据安全和隐私数据泄露事件频发,凸显大数据开展面临 的严峻挑战。在大数据环境下,数据在采集、存储、跨境跨系统流 转、利用、交易和销毁等环节的全生命周期过程中,所有权与管理 权别离,真假难辨,多系统、多环节的信息隐性留存,导致数据跨 境跨系统流转追踪难、控制难,数据确权和可信销毁也更加困难。二核心技术薄弱。基础理论与核心技术的落后导致我国信息技术长 期存在“空心化和"低端化'问题,大数据时代需防止此问题在 新一轮开展中再次出现。近年来,我国在大数据应用领域取得较大 进展,但是基础理论、核心器件和算法、软件等层面,较之美国等 技术兴旺国家仍明显落后。在大数据管理、处理系统与工具方面, 我国主要依赖国外开源社区的开源软件,然而,由于我国对国际开 源社区的影响力较弱,导致对大数据技术生态缺乏自主可控能力, 这成为制约我国大数据产业开展和国际化运营的重大隐患。三是融 合应用有待深化。我国大数据与实体经济融合不够深入,主要问题 表现在:基础设施配置不到位,数据采集难度大;缺乏有效引导与 支撑,实体经济数字化转型缓慢;缺乏自主可控的数据互联共享平 台等。当前,工业互联网成为互联网开展的新领域,然而仍存在不 少问题:政府热、企业冷,政府时有工程式"运动式推进, 而企业由于没看到直接、快捷的好处,接受度低;设备设施的数字 化率和联网率偏低;大多数大企业仍然倾向打造难以与外部系统交 互数据的封闭系统,而众多中小企业数字化转型的动力和能力严重 缺乏;国外厂商的设备在我国具有垄断地位,这些企业纷纷推出相 应的工业互联网平台,抢占工业领域的大数据基础服务市场。假设干思考和建议 大力开展行业大数据应用当前,我国互联网领域的大数据应用市场 化程度高、开展较好,但行业应用广度和深度明显缺乏,生态系统 亟待形成和开展。事实上,与实体经济紧密结合的行业大数据应用 蕴含了更加巨大的开展潜力和价值。以制造业为例,麦肯锡研究报 告称:制造企业在利用大数据技术后,其生产本钱能够降低 10%15%。而大数据技术对制造业的影响远非本钱这一个方面。 利用源于产品生命周期中市场、设计、制造、服务、再利用等各个 环节数据,制造业企业可以更加精细、个性化地了解客户需求,建 立更加精益化、柔性化、智能化的生产系统,创造包括销售产品、 服务、价值等多样的商业模式,并实现从应激式到预防式的工业系 统运转管理模式的转变。建立系统全面的大数据治理体系大数据是数字经济的关键要素,强 大的信息技术产业和全面深度信息化赋能的传统行业无疑是数字经 济的基础!大数据治理须从营造大数据产业开展环境的视角予以全 面、系统化考虑。在一国之内,大数据治理体系建设涉及国家、行 业和组织三个层次,至少包含数据的资产地位确立、管理体制机制、 共享与开放、安全与隐私保护等四方面内容,需要从制度法规、标 准规范、应用实践和支撑技术等视角多管齐下,提供支撑。在国家 层次,重点是要在法律法规层面明确数据的资产地位,奠定数据确 权、流通、交易和保护的基础,制定促进数据共享开放的政策法规 和标准规范,促进政务数据和行业数据的融合应用,并且出台数据 安全与隐私保护的法律法规,保障国家、组织和个人的数据安全。 在行业层次,重点是要在国家相关法律法规框架下,充分考虑本行 业中企业的共同利益与长效开展,建立规范行业数据管理的组织机 构和数据管控制度,制定行业内数据共享与开放的规那么和技术规范, 促进行业内数据的共享交换和融合应用。在组织层次,重点是要提 升企业对数据全生命期的管理能力,促进企业内部和企业间的数据 流通,提升数据变现能力,保障企业自身的数据安全及客户的数据 安全和隐私信息。以开源为基础构建自主可控的大数据产业生态在大数据时代,软件 开源和硬件开放已成为不可逆的趋势,掌控开源生态,已成为国际 产业竞争的焦点。建议采用参与融入、蓄势引领的开源推进策 略,一方面鼓励我国企业积极参与融入国际成熟的开源社区, 争取话语权;另一方面,也要在建设基于中文的开源社区方面加大 投入,汇聚国内软硬件资源和开源人才,打造自主可控开源生态, 在学习实践中逐渐成长壮大,伺机实现引领开展。积极推动国际合作并筹划布局跨国数据共享机制在数字经济快速发 展的时代背景下,我国应该积极推动在大数据技术和应用方面的国 际合作,建立跨国数据共享机制,与其他国家一起提供数字经济的 红利,同时也使我国获得更多开展机遇和更大开展空间,积极促进 数字经济下人类利益共同体和命运共同体的构建。未雨绸缪防范大数据开展可能带来的新风险大数据开展可能导致一 系列新的风险。例如,数据垄断可能导致数据黑洞现象。一些 企业凭借先开展起来的行业优势,不断获取行业数据,但却有收 无放,呈现出数据垄断的趋势。这种数据垄断不仅不利于行业的 健康开展,而且有可能对国家安全带来冲击和影响。又如,数据和算法可能导致人们对其过分"依赖及社会"被割裂等伦理问题。大数据分析算法根据各种数据推测用户的偏好并推荐内容,在带来 便利的同时,也导致人们只看到自己"希望看到的信息,从而使 人群被割裂为多个相互之间难以沟通、理解的群体,其可能引发的 社会问题将是难以"亡羊补牢的。帮助其更好地了解企业现状,进而做出判断和决策。第二层,预测 性分析应用,是指从大数据中分析事物之间的关联关系、开展模式 等,并据此对事物开展的趋势进行预测。如微软公司纽约研究院研 究员David Rothschild通过收集和分析赌博市场、证券交易所、社交媒体用户发布的帖子等大量公开数据,建立预测模型,对多届奥 斯卡奖项的归属进行预测。2014和2015年,均准确预测了奥斯卡 共24个奖项中的21个。第三层,指导性分析应用,是指在前两个 层次的基础上,分析不同决策将导致的后果,并对决策进行指导和 优化。如无人驾驶汽车分析高精度地图数据和海量的激光雷达、摄 像头等传感器的实时感知数据,对车辆不同驾驶行为的后果进行预 判,并据此指导车辆的自动驾驶。当前,在大数据应用的实践中, 描述性、预测性分析应用多,决策指导性等更深层次分析应用偏少。般而言,人们做出决策的流程通常包括:认知现状、预测未来和 选择策略这三个基本步骤。这些步骤也对应了上述大数据分析应用 的三个不同层次。不同层次的应用意味着人类和计算机在决策流程 中不同的分工和协作。例如:第一层次的描述性分析中,计算机仅 负责将与现状相关的信息和知识展现给人类专家,而对未来态势的 判断及对最优策略的选择仍然由人类专家完成。应用层次越深,计 算机承当的任务越多、越复杂,效率提升也越大,价值也越大。然而,随着研究应用的不断深入,人们逐渐意识到前期在大数据分析 应用中大放异彩的深度神经网络尚存在基础理论不完善、模型不具 可解释性、鲁棒性较差等问题。因此,虽然应用层次最深的决策指 导性应用,当前已在人机博弈等非关键性领域取得较好应用效果, 但是,在自动驾驶、政府决策、军事指挥、医疗健康等应用价值更 高,且与人类生命、财产、开展和安全紧密关联的领域,要真正获 得有效应用,仍面临一系列待解决的重大基础理论和核心技术挑战, 大数据应用仍处于初级阶段。未来,随着应用领域的拓展、技术的提升、数据共享开放机制的完善,以及产业生态的成熟,具有更大 潜在价值的预测性和指导性应用将是开展的重点。大数据治理数据治理体系远未形成,特别是隐私保护、数据安全与 数据共享利用效率之间尚存在明显矛盾,成为制约大数据开展的重 要短板,各界已经意识到构建大数据治理体系的重要意义,相关的 研究与实践将持续加强。随着大数据作为战略资源的地位日益凸显, 人们越来越强烈地意识到制约大数据开展最大的短板之一就是:数 据治理体系远未形成,如数据资产地位确实立尚未达成共识,数据 确实权、流通和管控面临多重挑战;数据壁垒广泛存在,阻碍了数 据的共享和开放;法律法规开展滞后,导致大数据应用存在安全与 隐私风险等。上述种种因素,制约了数据资源中所蕴含价值的挖掘 与转化。其中,隐私、安全与共享利用之间的矛盾问题尤为凸显。一方面,数据共享开放的需求十分迫切。近年来人工智能应用取得 的重要进展,主要源于对海量、高质量数据资源的分析和挖掘。而 对于单一组织机构而言,往往靠自身的积累难以聚集足够的高质量 数据。另外,大数据应用的威力,在很多情况下源于对多源数据的 综合融合和深度分析,从而获得从不同角度观察、认知事物的全方 位视图。而单个系统、组织的数据往往仅包含事物某个片面、局部 的信息,因此,只有通过共享开放和数据跨域流通才能建立信息完 整的数据集。然而,另一方面,数据的无序流通与共享,又可能导 致隐私保护和数据安全方面的重大风险,必须对其加以规范和限制。 例如,鉴于互联网公司频发的、由于对个人数据的不正当使用而导 致的隐私安全问题,欧盟制定了 史上最严格的数据安全管理法 规通用数据保护条例。2020年1月1日,被称为美国"最严 厉、最全面的个人隐私保护法案 加利福利亚消费者隐私法 案(CCPA )正式生效。在我国,2019年中央网信办发布了数 据安全管理方法(征求意见稿),向社会公开征求意见,明确了 个人信息和重要数据的收集、处理、使用和安全监督管理的相关标 准和规范。近年来,围绕大数据治理这一主题及其相关问题,国际 上已有不少成功的实践和研究探索工作。然而,考察当前的研究和 实践,仍存在三个方面的主要问题。一是大数据治理概念的使用相 对狭义,研究和实践大都以企业组织为对象,仅从个体组织的 角度考虑大数据治理的相关问题,这与大数据跨界流动的迫切需求 存在矛盾,限制了大数据价值的发挥。二是现有研究实践对大数据 治理内涵的理解尚未形成共识,不同研究者从流程设计、信息治理 和数据管理应用等不同视角,给出了大数据治理的不同定义,共识 的形成尚有待时日。三是大数据治理相关的研究实践多条线索并行, 关联性、完整性和一致性缺乏。诸如,国家层面的政策法规和法律 制定等较少被纳入大数据治理的视角;数据作为一种资产的地位仍 未通过法律法规予以确立,难以进行有效的管理和应用;大数据管 理已有不少可用技术与产品,但还缺乏完善的多层级管理体制和高 效管理机制;如何有机结合技术与标准,建立良好的大数据共享与 开放环境仍需要进一步探索。大数据技术数据规模高速增长,现有技术体系难以满足大数据应用 的需求,大数据理论与技术远未成熟,未来信息技术体系将需要颠 覆式创新和变革。近年来,数据规模呈几何级数高速成长。据国际 信息技术咨询企业国际数据公司(IDC )的报告,2030年全球数据 存储量将到达2500ZB。当前,需要处理的数据量已经大大超过处 理能力的上限,从而导致大量数据因无法或来不及处理,而处于未被利用、价值不明的状态,这些数据被称为暗数据。据国际商 业机器公司(IBM )的研究报告估计,大多数企业仅对其所有数据 的1%进行了分析应用。近年来,大数据获取、存储、管理、处理、 分析等相关的技术已有显著进展,但是大数据技术体系尚不完善, 大数据基础理论的研究仍处于萌芽期。首先,大数据定义虽已达成 初步共识,但许多本质问题仍存在争议,例如:数据驱动与规那么驱 动的对立统一、“关联与因果的辩证关系、"全数据的时 空相对性、分析模型的可解释性与鲁棒性等;其次,针对特定数据 集和特定问题域已有不少专用解决方案,是否有可能形成"通用 或"领域通用的统一技术体系,仍有待未来的技术开展给出答案; 其三,应用超前于理论和技术开展,数据分析的结论往往缺乏坚实 的理论基础,对这些结论的使用仍需保持谨慎态度。推演信息技术 的未来开展趋势,较长时期内仍将保持渐进式开展态势,随技术发 展带来的数据处理能力的提升将远远落后于按指数增长模式快速递 增的数据体量,数据处理能力与数据资源规模之间的剪刀差将 随时间持续扩大,大数据现象将长期存在。在此背景下,大数据现 象倒逼技术变革,将使得信息技术体系进行一次重构,这也带来了 颠覆式开展的机遇。大数据与数字经济 大数据是信息技术开展的必然产物,更是信息化进程的新阶段,其 开展推动了数字经济的形成与繁荣。当前,我们正在进入以数据的 深度挖掘和融合应用为主要特征的智能化阶段(信息化3.0 )0在人机物三元融合的大背景下,以万物均需互联、一切皆可编 程为目标,数字化、网络化和智能化呈融合开展新态势。在信息 化开展历程中,数字化、网络化和智能化是三条并行不悖的主线。数字化奠定基础,实现数据资源的获取和积累;网络化构建平台, 促进数据资源的流通和汇聚;智能化展现能力,通过多源数据的融 合分析呈现信息应用的类人智能,帮助人类更好地认知复杂事物和 解决问题。信息化新阶段开启的另一个重要表征是信息技术开始从 助力经济开展的辅助工具向引领经济开展的核心引擎转变,进而催 生一种新的经济范式数字经济。数字经济是指以数字化知 识和信息为关键生产要素、以现代信息网络为重要载体、以信息通 信技术的有效使用为效率提升和经济结构优化的重要推动力的一系 列经济活动,是以新一代信息技术和产业为依托,继农业经济、工 业经济之后的新经济形态。从构成上看,农业经济属单层结构,以 农业为主,配合以其他行业,以人力、畜力和自然力为动力,使用 手工工具,以家庭为单位自给自足,社会分工不明显,行业间相对 独立。工业经济是两层结构,即提供能源动力和行业制造设备的装 备制造产业,以及工业化后的各行各业,并形成分工合作的工业体 系。数字经济那么可分为三个层次:提供核心动能的信息技术及其装 备产业、深度信息化的各行各业以及跨行业数据融合应用的数据增 值产业。当前,数字经济正处于成型展开期,将进入信息技术引领 经济开展的爆发期、黄金期。从另一个视角来看,如果说过去20 多年,互联网高速开展引发了一场社会经济的"革命,深刻地改 变了人类社会,现在可以看到,互联网革命的上半场已经结束。上 半场的主要特征是2C(面向最终用户),主战场是面向个人提 供社交、购物、教育、娱乐等服务,可称为"消费互联网。而互 联网革命的下半场正在开启,其主要特征将是“2B"(面向组织机 构),重点在于促进供给侧的深刻变革,互联网应用将面向各行业, 特别是制造业,以优化资源配置、提质增效为目标,构建以工业物 联为基础和工业大数据为要素的工业互联网。作为互联网开展的新 领域,工业互联网是新一代信息技术与生产技术深度融合的产物, 它通过人、机、物的深度互联,全要素、全产业链、全价值链的全 面链接,推动形成新的工业生产制造和服务体系。当前,新一轮工 业革命正在拉开帷幕,在全球范围内不断颠覆传统制造模式、生产 组织方式和产业形态,而我国正处于由数量和规模扩张向质量和效 益提升转变的关键期,需要抓住历史机遇期,促进新旧动能转换,形成竞争新优势。我国是制造大国和互联网大国,推开工业互联网创新开展具备丰富的应用场景、广阔的市场空间和巨大的推进动力。数字经济未来开展呈现如下趋势:一是以互联网为核心的新一代信 息技术正逐步演化为人类社会经济活动的基础设施,并将对原有的 物理基础设施完成深度信息化改造和软件定义,在其支撑下,人类 极大地突破了沟通和协作的时空约束,推动平台经济、共享经济等 新经济模式快速开展。二是各行业工业互联网的构建将促进各种业 态围绕信息化主线深度协作、融合,在完成自身提升变革的同时, 不断催生新的业态,并使一些传统业态走向消亡。三是在信息化理 念和政务大数据的支撑下,政府的综合管理服务能力和政务服务的 便捷性持续提升,公众积极参与社会治理,形成共策共商共治的良 好生态。四是信息技术体系将完成蜕变升华式的重构,释放出远超 当前的技术能力,从而使蕴含在大数据中的巨大价值得以充分释放, 带来数字经济的爆发式增长。我国大数据开展的态势我国在大数据方面仍存在一系列亟待补上的 短板。一是大数据治理体系尚待构建。首先,法律法规滞后。目前, 我国尚无真正意义上的数据管理法规,只在少数相关法律条文中有涉及数据管理、数据安全等规范的内容,难以满足快速增长的数据 管理需求。其次,共享开放程度低。推动数据资源共享开放,将有