中国大数据研究现状与发展.pptx
《中国大数据研究现状与发展.pptx》由会员分享,可在线阅读,更多相关《中国大数据研究现状与发展.pptx(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中国大数据研究中国大数据研究现现状与状与发发展展中美工程技术研讨会中美工程技术研讨会报告人:报告人:杨善林杨善林2014年年5月月27日日一一 对大数据的认识对大数据的认识二二 大数据的研究概况大数据的研究概况三三 大数据中的科学问题大数据中的科学问题四四 大数据与管理决策大数据与管理决策报告提纲报告提纲 中国大数据研究现状与发展中国大数据研究现状与发展 实实践先于理践先于理论论,理,理论论指指导实导实践。践。在提出大数据概念之前,在提出大数据概念之前,实实际际上已有很多关于大数据的上已有很多关于大数据的获获取、存取、存储储、处处理和利用方法的研究成理和利用方法的研究成果。果。这说这说明明实实
2、践是先于理践是先于理论论的,当然深入的理的,当然深入的理论论研究一定能研究一定能够够促促进进大数据大数据应应用用实实践更好更快的践更好更快的发发展。展。一一 对大数据的认识对大数据的认识 关于大数据的神奇传说关于大数据的神奇传说 谷谷歌歌通通过过观观察察人人们们在在网网上上的的搜搜索索记记 录录,提提前前几几周周成成功功预预测测了了2009年年在在 美美国爆国爆发发的甲型的甲型H1N1流感。流感。埃埃齐齐奥奥尼尼利利用用大大数数据据创创立立了了一一个个机机 票票价价格格预预测测系系统统,准准确确度度高高达达75%,平均每平均每张张机票可机票可节节省省50美元。美元。一一 对大数据的认识对大数据
3、的认识 斯斯洛洛登登事事件件。2013年年,斯斯诺诺登登揭揭露露了了美美国国正正在在实实施施的的“棱棱镜镜”计计划划。通通过过大大数数据据分分析析对对全全球球实实施施监监听听,为为安安全全部部门门先先发发制制人人的的预预防防恐恐怖怖主主义义和和危危害害美美国国利利益的行益的行为为,提供了前所未有的可能。,提供了前所未有的可能。IBM智智慧慧的的分分析析洞洞察察。每每个个月月,全全球球发发布布10亿亿条条Twitter信信息息和和300亿亿条条Facebook信信息息。预预计计到到2020,总总量量增增长长约约44倍倍。基基于于大大数数据据的的企企业业数数据据分分析析正正成成为为IBM的利的利润
4、润增增长长。一一 对大数据的认识对大数据的认识 大数据时代大数据时代中的主要观点:大数据引起的思维变革中的主要观点:大数据引起的思维变革 在在大大数数据据时时代代进进行行抽抽样样分分析析就就像像是是在在汽汽车车时时代代骑骑马马一一样样,我我们们分析数据会完全抛弃样本分析,而关注数据的总体。分析数据会完全抛弃样本分析,而关注数据的总体。即即“样本样本=总体总体”。在在大大数数据据时时代代,我我们们不不再再担担心心某某个个数数据据点点对对整整套套分分析析的的不不利利影影响响,我我们们要要做做的的就就是是要要接接受受这这些些纷纷繁繁的的数数据据并并从从中中受受益益,而而不不再以高昂的代价消除所有的不
5、确定性。再以高昂的代价消除所有的不确定性。大大数数据据时时代代对对我我们们的的生生活活,以以及及与与世世界界交交流流的的方方式式都都提提出出了了挑挑战,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。战,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。一一 对大数据的认识对大数据的认识 总总之,我之,我们们需要改需要改变变我我们们的思的思维维方式,使用我方式,使用我们们能收集到的所能收集到的所有数据,而不有数据,而不仅仅仅仅是使用是使用样样本。我本。我们们不能再把精确性当成重心,我不能再把精确性当成重心,我们们需要接受混乱和需要接受混乱和错误错误的存在。另外,我的存在。另外,我们应该侧
6、们应该侧重于分析相关关重于分析相关关系,而不再系,而不再寻寻求每个求每个预测预测背后的原因。背后的原因。引自引自Big Data:A RevolutionThat Will Transform How We Live,Work and Think一一 对大数据的认识对大数据的认识 关于大数据的定义关于大数据的定义1.美国国家科学基金委(美国国家科学基金委(NSF)的定)的定义义 大数据是指由科学大数据是指由科学仪仪器、器、传传感器、网上交易、感器、网上交易、电电子子邮邮件、件、视频视频、点点击击流和流和/或所有其它或所有其它现现在或将来可用的数字源在或将来可用的数字源产产生的大生的大规规模、多
7、模、多样样的、复的、复杂杂的、的、纵纵向的和向的和/或分布式的数据集。或分布式的数据集。这这个定个定义义指出了大数据是一指出了大数据是一类类数据集,并指出了大数据数据集,并指出了大数据现现在和在和将来的数据来源,以及大数据具有大将来的数据来源,以及大数据具有大规规模、多模、多样样性、复性、复杂杂性、分布性、分布性、关性、关联联性等数据特征。性等数据特征。一一 对大数据的认识对大数据的认识 2.麦肯麦肯锡锡公司(公司(McKinsey&Company)的定)的定义义 大数据是一个大的数据池,其中的数据可以被采集、大数据是一个大的数据池,其中的数据可以被采集、传递传递、聚集、聚集、存、存储储和分析
8、。目前,大数据是全球和分析。目前,大数据是全球经济经济每个部每个部门门和功能的一部分。和功能的一部分。与固定与固定资产资产和人力和人力资资本等其它重要的生本等其它重要的生产产要素要素类类似,没有数据,很多似,没有数据,很多现现代代经济经济活活动动、创创新和增新和增长长都不会都不会发发生,生,这这正成正成为为越来越普遍的越来越普遍的现现象。象。这这个定个定义义指出大数据是一个大的数据集合,它与固定指出大数据是一个大的数据集合,它与固定资产资产、人力、人力资资本一本一样样,也是一种生,也是一种生产产要素,并能支持要素,并能支持现现代代经济经济增增长长和和创创新活新活动动。因此,大数据研究的关因此,
9、大数据研究的关键键科学科学问题应该问题应该是大数据与是大数据与经济经济增增长长和和创创新活新活动动的关系。的关系。一一 对大数据的认识对大数据的认识 3.IBM公司的定公司的定义义 可以用四个特征来描述大数据,即可以用四个特征来描述大数据,即规规模性(模性(Volume)、高速性)、高速性(Velocity)、多)、多样样性(性(Variety)和真)和真实实性(性(Veracity),),这这些特征些特征相相结结合,定合,定义义了了IBM所称的所称的“大数据大数据”。这这个定个定义显义显然也是把大数据定然也是把大数据定义为义为一种数据集合,而且一种数据集合,而且这这些数些数据具有据具有规规模
10、性、高速性、多模性、高速性、多样样性和真性和真实实性。所以,大数据研究所关性。所以,大数据研究所关心的科学心的科学问题问题就就应该应该是是对结对结构多构多样样性的大数据能性的大数据能够进够进行高速存行高速存储储和和高速高速处处理的技理的技术术。一一 对大数据的认识对大数据的认识 4.维维基百科(基百科(Wikipedia)的定)的定义义 大数据是指大数据是指规规模模庞庞大且复大且复杂杂的数据集合,很的数据集合,很难难用常用常规规的数据的数据库库管理工具或管理工具或传统传统数据数据处处理理应应用用对对其其进进行行处处理。其主要挑理。其主要挑战战包括数据包括数据抓取、策展、存抓取、策展、存储储、搜
11、索、共享、搜索、共享、转换转换、分析和可、分析和可视视化。化。显显然然这这个定个定义义是从大数据的是从大数据的处处理方法和理方法和处处理工具的理工具的视视角来看待角来看待大数据的,根据大数据的,根据这这个定个定义义,大数据研究,大数据研究应该围绕应该围绕大数据的快速大数据的快速处处理理方法和方法和软软件工具的研件工具的研发发来展开,研究的目的就是要得到大数据的快来展开,研究的目的就是要得到大数据的快速速处处理方法和非常理方法和非常规规的的软软件工具。大数据始件工具。大数据始终终在在“大数据大数据”和和“非大非大数据数据”之之间间不断的不断的转换转换。一一 对大数据的认识对大数据的认识 从管理的
12、角度看大数据从管理的角度看大数据 定定义义:大数据是一:大数据是一类类能能够够反映物反映物质质世界和精神世界的运世界和精神世界的运动动状状态态和状和状态变态变化的信息化的信息资资源,它具有决策有用性以及海量性、异构性、源,它具有决策有用性以及海量性、异构性、增增长长性、复性、复杂杂性和可重复开采性,一般都具有多种潜在价性和可重复开采性,一般都具有多种潜在价值值。这这个定个定义义把大数据看做是一把大数据看做是一类资类资源,它具有决策有用性,源,它具有决策有用性,对经对经济济社会社会发发展具有重要的潜在价展具有重要的潜在价值值。按照大数据的。按照大数据的资资源源观观,大数据研,大数据研究的关究的关
13、键键科学科学问题应该问题应该包括大数据的包括大数据的获获取方法、加工技取方法、加工技术术、应应用模用模式以及大数据的式以及大数据的产权问题产权问题、相关的、相关的产业发产业发展展问题问题和相和相应应的法律法的法律法规规建建设问题设问题。一一 对大数据的认识对大数据的认识 大数据的来源和应用领域大数据的来源和应用领域 大数据具有广大数据具有广阔阔的的应应用前景。数据用前景。数据驱动驱动的决策由来已久。的决策由来已久。数据数据+决策能力决策能力=决策。决策。生生产产制造、物流交通、商制造、物流交通、商务过务过程、程、资资源源环环境、教育文化、医境、教育文化、医疗疗卫卫生、社交信息、生命科学、天文地
14、理、航空航天、政府部生、社交信息、生命科学、天文地理、航空航天、政府部门门、国、国家安全等家安全等领领域既是大数据的来源又是大数据的域既是大数据的来源又是大数据的应应用用领领域。域。一个一个应应用可能用可能对应对应多个来源。多个来源。一一 对大数据的认识对大数据的认识 大数据与物联网、云计算大数据与物联网、云计算 物物联联网网、云云计计算算、大大数数据据都都是是依依托托互互联联网网并并相相互互依依存存的的有有机机整整体体,是是信信息息技技术术的的新新发发展展。对对大大数数据据来来说说,物物联联网网既既是是数数据据来来源源,又又是是数数据据用用户户,云云计计算算则则是是大大数数据据存存储储、处处
15、理理的的一一种种方方式式。随随着着物物联联网网和和云云计计算技算技术术的的发发展,大数据展,大数据应应用和大数据用和大数据产业产业一定能一定能够够更快的更快的发发展。展。一一 对大数据的认识对大数据的认识 国际大数据研究状况国际大数据研究状况二二 大数据研究概况大数据研究概况美国:大数据研究与发展计划(2012)主主要要任任务务:“通通过过收收集集庞庞大大而而复复杂杂的的数数字字资资料料,加加速速在在科科学学、工工程程上上发发现现的的步步伐伐,强强化化美美国国国国土土安安全全,转转变变教教育和学习模式。利用大数据技术实现在科研教学、环境保护、工程技术、国土安全、生物医药等方面的新突破育和学习模
16、式。利用大数据技术实现在科研教学、环境保护、工程技术、国土安全、生物医药等方面的新突破”英国:商业、创新和技能部宣布将注资1.89亿英镑用来发展大数据技术(2013)主主要要任任务务:“政政府府在在计计算算基基础础设设施施方方面面投投入入巨巨资资,加加强强数数据据采采集集和和分分析析,吸吸引引企企业业在在这这一一领领域域的的投投资资,从从而而在在数数据革命中占得先机。在本届议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库据革命中占得先机。在本届议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库”法国:数字化路线图(2013)主主要要任任务务:“在在20132013年年投投
17、入入11501150万万欧欧元元,用用于于7 7个个大大数数据据市市场场研研发发项项目目,目目的的在在于于通通过过发发展展创创新新性性解解决决方方案案,并并将其用于实践,来促进法国在大数据领域的发展将其用于实践,来促进法国在大数据领域的发展”日本:新一轮IT振兴计划(2012)主主要要任任务务:“在在20122012新新一一轮轮ITIT振振兴兴计计划划中中,将将发发展展大大数数据据作作为为国国家家战战略略层层面面提提出出,重重点点关关注注大大数数据据应应用用技技术术,如社会化媒体等智能技术的开发、新医疗技术的开发、以及交通拥堵治理等公共领域的应用。如社会化媒体等智能技术的开发、新医疗技术的开发
18、、以及交通拥堵治理等公共领域的应用。”大数据与企业管理大数据与企业管理 2012 IBM Global CEO Survey(调调研研1700多多位位来来自自全全球球64个个国国家家的的CEO)指指出出,业业绩绩出出众众的的企企业业能能够够访访问问更更多多数数据据,更更善善于于挖挖掘掘出出有有意意义义的的客客户户洞洞察察。73%的的CEO将将对对组组织织进进行行重重大大投投资资,以以期期从从大大数数据据中中挖挖掘掘出出更更多多的的有用信息。有用信息。IBM报告报告http:/ 大数据研究概况大数据研究概况 二二 大数据研究概况大数据研究概况智能建筑与城市规划环 境能源与水资源交 通教 育健康保
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 数据 研究 现状 发展
限制150内