大数据简介-应用及技术简述幻灯片课件.ppt
《大数据简介-应用及技术简述幻灯片课件.ppt》由会员分享,可在线阅读,更多相关《大数据简介-应用及技术简述幻灯片课件.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据简介大数据简介-应用及技术应用及技术简述简述1Part什么是大数据Part 1 什么是大数据何为大?数据度量1Byte=8 Bit1KB =1,024 Bytes1MB =1,024 KB=1,048,576 Bytes1GB =1,024 MB=1,048,576 KB=1,073,741,824 Bytes1TB =1,024 GB=1,048,576 MB=1,099,511,627,776 Bytes1PB =1,024 TB=1,048,576 GB=1,125,899,906,842,624 Bytes1EB =1,024 PB=1,048,576 TB=1,152,921,
2、504,606,846,976 Bytes1ZB =1,024 EB=1,180,591,620,717,411,303,424 Bytes1YB =1,024 ZB=1,208,925,819,614,629,174,706,176 Bytes数据没有办法在可容忍的时间下使用常规软件方法完成存数据没有办法在可容忍的时间下使用常规软件方法完成存储、管理和处理任务储、管理和处理任务Part 2 大数据的特征BigData大数据Volume非结构化数据的超大规模和增长总数据量的8090%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍数据量体Value大量的不相关信息对未来趋势与模式
3、的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能)数据价值Variety大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义数据多样 Velocity实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效数据速度Part 2 大数据的4V特征Volume1Bity1KB1MB1GB1TB1PB1EB1ZB1YB1PB相当于50%的全美学术研究图书馆藏书信息内容5EB相当于至今全世界人类所讲过的话语1ZB如同全世界海滩上的沙子数量总和1YB相当于7000位人类体内的微细胞总和一般情况下,大数据是以PB、EB、ZB为单位进行计量的
4、Part 2 大数据的4V特征Velocity大数据的处理速度快实时数据流处理的要求,是区别大数据引用和传统数据仓库技术,BI技术的关键差别之一;1s是临界点,对于大数据应用而言,必须要在1秒钟内形成答案,否则处理结果就是过时和无效的;82254132215327现在及未来几年内美国的移动网络数据流量增长(PB/月)源自英国Coda研究咨询公司大数据的增长速度快Part 2 大数据的4V特征Variety行业/企业内数据互联网数据物联网数据大数据数据来源多企业内部多个应用系统的数据、互联网和物联网的兴起,带来了微博、社交网站、传感器等多种来源。数据类型多保存在关系数据库中的结构化数据只占少数,
5、7080%的数据是如图片、音频、视频、模型、连接信息、文档等非结构化和半结构化数据。关联性强数据之间频繁交互,比如游客在旅行途中上传的图片和日志,就与游客的位置、行程等信息有了很强的关联性。Part 2 大数据的4V特征Value价值密度低(Value)价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息3Part大数据技大数据技术简介及介及现况况Part 3 大数据技术简介数据采集数
6、据预处理数据存储数据分析挖掘数据可视化实时处理 Spark Storm机器语音R语言关联分析用户画像构建 推理预测知识图谱2D法时间可视化多维法 层次法分布式架构 Hadoop MapReduce数据库体系 NoSQLNewSQLMPP混合架构Lambda架构数据清理 遗漏值处理 噪音数据数据集成 实体识别 数据冗余数据归约 维度归约 数值归约硬件采集 传感技术 RFID软件采集系统日志抓取企业特定API、网络众包Part 3 大数据技大数据技术现况况将在三个将在三个环节分分层突破突破采集端多源数据融合社交数据、IOT数据 等外部数据与企业内 部数据融合拉通运营化发展通过长期采集积累 海量数据
7、资源的企 业实现数据联合运 营分析端处理实时化针对网络视频化潮流,更加强化对实时流数 据的处理能力高效化数据量的不断增加,云端处理API结合后 台支撑将使数据处理 更加高效应用端智能化以机器学习作为核心,将实现对用户需求的自 我理解和智能迭代云端化云计算和移动互联网 将促进大数据应用从2B市场迅速推广到2C市场Part 3 大数据及其关联技术物物联网网云云计算算大数据大数据物联网是大数据的重要来源大数据技术为物联网数据分析提供支撑云计算为物联网提供海量数据存储能力物联网为云计算技术提供了广阔的应用空间云计算为大数据提供了技术基础,大数据为云计算提供用武之地 云计算、大数据和物联网代表了IT领域
8、最新的技术发展趋势,三者既有区别又有联系4Part大数据大数据应用用Part 4大数据主要用途21%16%24%21%18%精准经营降低成本智能服务风险管理创新经营24%的大数据企业认为在为用户实施智能服务方面有较大帮助数据价值体现在三个方面增加收入减少支出降低风险Part 4大数据主要应用行业能源行业随着智能电网的发展,电力公司可以掌握海量的用户用电信息,利用大数据技术分析用户用电模式,可以改进电网运行,合理设计电力需求响应系统,确保电网运行安全。物流行业利用大数据优化物流网络,提高物流效率,降低物流成本。城市管理可以利用大数据实现智能交通、环保监测、城市规划和智能安防。生物医学大数据可以帮
9、助我们实现流行病预测、智慧医疗、健康管理,同时还可以帮助我们解读DNA,了解更多的生命奥秘。体育娱乐大数据可以帮助我们训练球队,决定投拍哪种题财的影视作品,以及预测比赛结果。安全领域政府可以利用大数据技术构建起强大的国家安全保障体系,企业可以利用大数据抵御网络攻击,警察可以借助大数据来预防犯罪。个人生活大数据还可以应用于个人生活,利用与每个人相关联的“个人大数据”,分析个人生活行为习惯,为其提供更加周到的个性化服务。大大数数据据主主要要应应用用行行业业Part 4大数据主要应用行业制造业利用工业大数据提升制造业水平,包括产品故障诊断与预测、分析工艺流程、改进生产工艺,优化生产过程能耗、工业供应
10、链分析与优化、生产计划与排程。金融行业大数据在高频交易、社交情绪分析和信贷风险分析三大金融创新领域发挥重大作用。汽车行业利用大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活。互联网行业借助于大数据技术,可以分析客户行为,进行商品推荐和针对性广告投放。餐饮行业利用大数据实现餐饮O2O模式,彻底改变传统餐饮经营方式。电信行业利用大数据技术实现客户离网分析,及时掌握客户离网倾向,出台客户挽留措施大大数数据据主主要要应应用用行行业业Part 4大数据应用领域不断丰富大数据应用领域不断丰富,从互联网、电信、金融开始向医疗、交通、政府领域深入2018年中国大数据市场行业结构预测基础电信金
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 简介 应用 技术 简述 幻灯片 课件
限制150内