大数据发展现况与趋势概述.pptx
《大数据发展现况与趋势概述.pptx》由会员分享,可在线阅读,更多相关《大数据发展现况与趋势概述.pptx(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据发展现况与趋势日 期:2016年6月22日单 位:贵阳大数据交易所报告人:专 业:信息管理硕士主 修:数据挖掘、决策支持经 历:从事富士康集团大数据业务15年内容项次项次主题主题内容重点内容重点报告时间报告时间1预备知识认识数据与目的5分钟2智能生活(1)视频5分钟3数据与生活案例学习30分钟4认识大数据大数据的前世今生大数据的定义中国大数据30分钟5从贵阳大数据交易所看贵阳大数据顶层设计大数据交易所贵阳大数据布局大数据交易所视频30分钟6大数据技术简介数据挖掘方法论30分钟7创意思考方法分享5分钟8智能生活(2)视频5分钟9互动交流10分钟预备知识(1/2)知识就是力量:人脑获取的的信
2、息进行系统化的提炼、研究和分析,进而形成知识。信息就是能量:通过人脑次级思维活动,实现对原始数据的筛选、加工、创造,进而产生有意义的数据。数据就是变量:未经组织的数字、词语、声音、图像的纪录,可以来自测量仪器的实时记录,也可以来自人的知识。数据信息知识人类思维逻辑演进人类思维范式演进(摘自块数据2.0一书)知识、信息与数据的双向演进预备知识(2/2)数据的终极目的决策支持预测优化增加效益防范风险(目的)(方法)(目标)智能生活(1)-视频5分钟数据与生活l保险业l地产行业l零售行业l物流行业l政府治理思路:透过(大)数据在生活中的应用,进而了解大数据的型态、样式、影响与效益客户属性养车APP移
3、动APP家庭成员商旅人群航空延误险旅游天气险手机被盗险行李遗失险专属理财保险寿险养老险教育险高端客群(保险公司)创新保险产品提升精算水平增加利润率提高投资收益稀有客群宠物险美甲险珠宝险保险行业大数据应用场景旅游业信息航空业信息医疗信息其他外部信息保险大数据源发掘设计提供发掘设计提供发掘设计提供获得分析分析位置信息1.常住人口2.年龄3.职业4.收入5.消费6.APP活跃程度7.其他土地价值土地投资成本地产开发风险案例:(身分)一家主要开发三线城市地产著名的房地产商。(事前)一次进入到一个城市时,当地政府非常欢迎,并拿出了一个拥有30万户籍人口的土地让房地产公司进行开发。(事中)房地产商开发完之
4、后,发现房子卖出去很少,同30万户籍人口的需求完全不在一个数量级上,房子积压了不少,造成了较大损失。(原因)房地产商很困惑,究竟是什么原因导致了房子滞销,经过一段时间的调研,地产公司发现:1、30万户籍人口中有一半以上在其他城市工作2、并且未来不会回来购买住房,其开发地块的常住人口住房购买需求较低,相当于10万户籍人口的需求。(事后)地产商按照30万人口需求开发的住宅小区,很难在当地短期内卖出去。本次房地产投资损失较大,导致房地产商从当地房产市场退出。地产行业大数据应用场景居住人口数进入人口数活动规律发现降低设计提升商铺位置服务内容产品类型动线设计客流量消费额服务体验生活爱好年龄分布消费热点客
5、户基本信息客户购物纪录购买喜好热门商品流行趋势时间周期商品组合改善动线货架布置推荐客户潜在需求商品精细化生产提升效率优化资源零售行业比较有名气的大数据案例就是沃尔玛的啤酒和尿布的故事,以及Target通过向年轻女孩寄送尿布广告而告知其父亲,女孩怀孕的故事。天猫和京东,已经通过客户的购买习惯,将客户日常需要的商品例如尿不湿,卫生纸,衣服等商品依据客户购买习惯事先进行准备。当客户刚刚下单,商品就会在24小时内或者30分钟内送到客户门口,提高了客户体验,让客户连后悔等时间都没有。零售行业大数据应用场景优化产品设计库存管理生产计划配置资源提升30%业绩供应链物流行业规模5万亿最后一公里物流3万亿元利润
6、率30%下降20%中国的物流产业规模大概有5万亿左右,其中公里物流市场大概有3万亿左右。物流行业的整体净利润从过去的30%以上降低到了20%左右,并且下降的趋势明显。全国物流网路各个节点的运货需求和运力降低货车的返程空载率,降低超载率,减少重复路线运输,降低小规模运输比例建立基于地理位置和产业链的物流港口实现货物和运力的实时配比,提高物流行业的运输效率及时了解各个路线货物运送需求提升10%(约5000亿)收入大数据手段物流行业大数据应用场景返程空载重复运输小规模运输传统管理改善大数据提升政府治理能力意义重大国务院发布了促进大数据发展行动纲要中提到,将建立“用数据说话、用数据决策、用数据管理、用
7、数据创新”的管理机制。1、揭示出与传统不同或难以展现的关联,增强政府决策的科学性2、提高政府监管市场、建立公平竞争环境的能力3、增强公共管理和服务能力,达到个性化和精准化服务的要求4、提升污染监控和环境保护成效,推进生态文明建设5、提高政府监管市场、建立公平竞争环境的能力大数据提升政府治理能力意义重大单位上海交通综合信息平台方式集成道路传感系统、出租车GPS系统、居民手机信号迁移、实时视频采集等多系统信息成效用以分析交通状况,增强交通管控措施的准确性和时效性,并提高了交通基础设施建设的科学决策水平。政府治理大数据应用场景(1/5)意义:揭示出与传统不同或难以展现的关联,增强政府决策的科学性单位
8、北京,企北京,企业与与监管部管部门合作合作上海的公共信用信息服上海的公共信用信息服务平台平台方式利用互联网和金融行业数据归集包括法人和自然人监管、执法、审批、资质等1200多个信息事项、3亿多条数据成效打击非法集资、违法违规交易供部门监管和信息主体查询政府治理大数据应用场景(2/5)意义:提高政府监管市场、建立公平竞争环境的能力单位上海申康医上海申康医联工程工程上海民政局上海民政局方式已完整收集38家三级甲等医院数据,目前又扩大收集范围,包括来自上海、广州、武汉等城市和20多个地级市的近1亿就诊人群,形成国际上最大的电子健康档案信息库和PB级的医学影像档案库通过居民经济状况核对系统成效完成17
9、.4万余户次申请家庭的经济状况核对,检出1.7万不合规户,节约公共财政19亿元。政府治理大数据应用场景(3/5)意义:提高政府监管市场、建立公平竞争环境的能力单位北京公众与环境研究中心方式采用汇总政府公布和志愿者收集数据等方式,制作了5大类13个子类的环境污染海量数据库成效直观展示各地各流域的环境质量和污染排放数据,还列出近15万家企业的环境监管记录,在监控污染状况、监督企业整改等方面发挥了重要作用。政府治理大数据应用场景(4/5)意义:提升污染监控和环境保护成效,推进生态文明建设单位广州市黄埔区广州市黄埔区重重庆庆方式面向社区整合大数据应用,实现“数据到楼、一图搞掂、一按全知、实时追踪、系统
10、整合、条块融合、现场直播、问效于民”基于大数据的电子车牌技术为公安机关采集办案信息700多万条成效排查纠纷隐患7.2万宗,就地化解率达98%,将很多社会矛盾化解于基层。实时支持交通管理预防暴恐事件的能力政府治理大数据应用场景(5/5)意义:提高政府监管市场、建立公平竞争环境的能力经由上述案例认识,是否可以列举咱们自身经历(或感受)到的大数据应用?大数据的前世今生1890年1943年1989年1997年2007年2008年2010年2011年2012年2014年由赫尔曼*霍勒瑞斯发明的可以由机器处理的穿孔卡片,突破突破传统人口普人口普查的困的困难,该设备让美美国用一年的国用一年的时间就完成了原本
11、用就完成了原本用8年的人口普年的人口普查活活动,在全球范围引发数据处理新纪元。英国“二战”期间开发能大规模数据处理的机器,并使用了第一台可编程的电子计算机进行运算,以每秒5 000字符的速度读卡,破译德军部队前方信息密码,帮助盟军成功登陆诺曼第。英国计算机科学家蒂姆*博纳斯*李开创了一个叫“万维网”的超文本系统,在全球范围内利用互联网实现信息共享。美国宇航局研究员迈克尔和大卫首次使用“大数据”这一语数来描述20世纪90年代面临的数据挑战。数据集之大,通常超出了主存储器、本地磁盘的存储能力,甚至远超磁盘的承载能力,故而称之为“大数据问题”。“大数据”一词开始在技术圈内出现。连线杂志发表文章阐述了
12、数据泛滥带来的机遇和挑战,称大数据是“Petabtye(拍字节)时代”的开端。计算机社区联盟作为最早提出大数据概念的机构,发表大数据计算:在商务、科学和社会领域创建革命性突破白皮书,提出提出“大数据真正作用的是新用途和新见解,而非数据本身大数据真正作用的是新用途和新见解,而非数据本身”。肯尼斯.库克尔在经济学人上发表大数据专题报告:数据,无所不在的数据。他在报告中提到:“世界上有着无法想象的巨量数字信息,并以极快的速度增长。”库克尔因此成为最早洞见大数据时代趋势的数据科学家之一。IBM的“沃森”超级计算机每秒可扫描并分析4TB(4太字节,约2亿页文字量)的数据量,并在美国著名智力竞赛节目危险边
13、缘上击败两名人类选手而夺冠,纽约时报将这一刻称为“大数据计算的胜利”。瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上发布的报告大数据,大影响宣称,数据已经成为一种新的资产类别,就像货币或黄金一样。世界经济论坛以“大数据的回报与风险”为主题发布全球信息技术报告(第13版),美国白宫发布2014年全球“大数据”白皮书研究报告大数据:抓住机遇、保存价值鉴古知今:大数据的前世今生大数据定义大数据的定义最早是源自于企业而非学术机构至目前为止,对大数据概念的讨论也尚未停止。学术界、产业界及政府机构都从自身领域、立场出发进行不同的界定。至今大数据的定义可由四个角度进行认识:1、技术分析角度2、大数据
14、应用价值角度3、大数据自身特征角度4、大数据对社会发展影响角度。大数据定义(1/4):技术分析角度【内容】关注的是对海量、复杂数据进行分析处理,从而获得信息和知识的技术手段【提出者】麦肯锡就认为,大数据是大小超出常规数据库工具的获取、储存、管理和分析能力的数据集,也指无法采用传统流程、工具处理或分析的信息,迫使用户采用非传统处理方法的数据集,数量级不一定要超过特定的数据存储容量值。维基百科认为,大数据是指无法再合理时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。数据集成软件商纳斯达克则认为,大数据包括海量数据和复杂数据类型,其规模超过传统数据库系统进行管理和处理的能力【内容】强调的是大
15、数据的应用,关注的是从数据中获取有价值的信息和知识,最终目的是建立商业方面的竞争优势甚至是创新商业模式。【提出者】高德纳咨询公司认为,大数据是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。维克托迈尔舍恩伯格认为,大数据时代的来临使得人类第一次有机会和条件在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。哈佛大学访问学者徐晋在大数据经济学中指出,大数据是指存在价值关联的海量数据。大数据的本质是社会经济的离散化解构与全息化重构,表现为行业海量数据的关系从量变到
16、质变的转换(深度挖掘)。赵国栋、易欢欢等在大数据时代的历史机遇一书中指出,大数据是在多样的或者大量的数据中迅速获取信息的能力。大数据定义(2/4):大数据应用价值角度【内容】是从大数据本身特质和特点对大数据进行界定。又可分为定量与定性角度说明。【提出者】1、从量的角度:百度百科认为,大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到颉取、管理、处理并整理成为有助于企业经营决策的资讯。大数据科学家约翰*劳瑟认为,大数据就是任何超过了一台计算机处理能力的庞大数据量。2、从性质的角度:高德纳咨询公司分析师道格兰尼首次提出大数据的3V特征,即高速增长的数据体量
17、(Volume),高速进出的数据运动(Velocity),高度异质的数据种类(Variety)。在此基础上,麦肯锡公司提出了大数据具有4V的特征,即:数据容量大(Volume)、数据类型繁多(Variety)、商业价值高(Value)、处理速度快(Velocity)。大数据定义(3/4):大数据自身特征角度【内容】强调大数据对人类社会生产生活方式、思维范式等产生的重大影响,认为大数据开启了人类发展的新阶段,并且认为这种范式的影响是持久而深远的。【提出者】维克托。迈尔-恩格教授提出,”大数据”所代表的是当今社会所独有的一种新型的能力以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产
18、品及服务,或深刻的洞见。中国工程院院士李国杰认为,理解大数据需要上升到文化和认识论的高度。数据文化的本质是尊重客观的实事求是,重视数据就是强调用事实说话,按理性思维的科学精神。大数据定义(4/4):大数据对社会发展影响角度中国的大数据战略2015年8月,促进大数据发展行动纲要的颁布,成为推动中国大数据发展的重要顶层设计和战略部署。党的十八届五中全会提出实施“国家大数据战略”,标志着大数据战略正式上升为国家战略。2016年3月,中华人民共和国国民经济和社会发展第十三个五年规划纲要,明确提出要把大数据作为国家的基础性战略资源。促进大数据发展行动纲要对大数据进行了全新界定,即“大数据是以容量大、类型
19、多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。这是国家层面对大数据最具权威的官方解读。这一新的定义,蕴含着大数据时代的三个基本特征,即新模式、新技术、新业态。科学认识这些特征可以帮助我们去探寻大数据带来的变化以及这些变化是如何发生的,这正是发现大数据的本质的过程。中国大数据的定义新模式:核心是新的思维范式。大数据不仅是一场技术革命,更是一场思维的革命。大数据思维范式的关键转变在于从人脑思维到电脑思维再到云脑思维的转变,这种思维具有以下特点:一是总体性,
20、伴随着数据在采集、存储、分析等相关技术上的突破,对于数据的获取实现了从样本数据到全体数据的转变。二是容错性,精确性是小数据时代的产物,当数据量无限大时,绝对的精准不再是数据追求的主要目标。三是相关性,也就是人们只需知道“是什么”,而不用知道“为什么”。四是智能性,只能是大数据时代的显着特征,思维方式从自然思维向只能思维转变,不断提升机器设备或系统设置的社会计算能力和智能化水平,从而获得具有洞察力和新价值的数据,甚至类似于人类的智能。中国大数据的定义新技术:核心是新的信息技术。大数据本身是什么并不重要,重要的是大数据背后蕴含的价值所带来的影响。大数据具有“容量大、类型多、存取速度快、应用价值高”
21、和“数据巨大、来源分散、格式多样”的特征,大数据的价值在于应用,必须依靠全新的处理方式,即新的数据采集技术、数据存储技术和拘束关联分析技术,从根本上解决“数据从哪里来、数据放在哪里、数据如何使用”这三大问题,实现通过数据发现新知识、创造新价值、提升新能力的目标。中国大数据的定义(1/3)新业态:核心是新的服务业态。大数据带来社会生产要素的开放共享、集约整合、协同开发和高效使用,改变了传统的生产方式和经济运行机制,持续激发商业模式创新,不断催生新业态。这种新业态以新的服务业态为核心,通过大数据驱动传统服务模式或商业模式的再创新。大数据在重构未来经济格局的同时,也将对传统的社会关系带来重构。中国大
22、数据的定义(2/3)从贵阳大数据交易所看贵阳大数据顶层设计宏观微观政府企业国资控股的交易平台,接受政府监督与监管,因此具有公信力的,经市场供需进行数据资产现货价值发现,获得鉴价凭证(703项目)后,可编入资产负债表,进而影响企业股价和融资能力。观察市场使用本身数据情况,发现新蓝海。大数据交易所为开放数据重要渠道之一。交易所以企业市场化运作,利用政府无偿数据孵化与建立大数据交易生态圈大数据交易所为政府开放数据与市场应用的最后一哩路,政府可透过大数据交易所获得市场对开放数据的需求,进而做为数据开放的参考与依据透过大数据交易所有偿购回与政府治理有关数据产品(发挥拉动市场的力量)与提升政府治理能力内部
23、经营使用指导决策优化管理不得违反国家安全、社会安全、商业隐私、个人安全等相关法律。贵阳大数据产业大数据商联盟:行业自律机制,确保会员资质,引领行业产生数据交易的法令法规、标准。陈刚市委书记6号:利用大数据进行政府治理7号:打造大数据产业链8号:利用大数据进行民生服务9号:引进高端产业产生大数据博士北京中关村项目参与北京朝阳区区长顶层设计战略布局任务与目的交易模式交易底线大数据交易所在贵阳大数据产业战略布局中的位置交易所(702)贵阳大数据发展1、策划国家级的大数据交易平台(系统)2、参与国家数据与数据交易标准的制定2.1国家大数据交易标准2.2大数据行业应用2.3大数据安全标准2.4大数据技术
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 发展 现况 趋势 概述
限制150内