2022年大数据技术在物联网服务平台中的应用 .pdf
《2022年大数据技术在物联网服务平台中的应用 .pdf》由会员分享,可在线阅读,更多相关《2022年大数据技术在物联网服务平台中的应用 .pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、82016 年2月 第 2 期(第29卷 总第221 期)月刊2016 年 第2期电信工程技术与标准化大数据与物联网专题大数据技术在物联网服务平台中的应用段为(中国移动通信集团广东有限公司,广州 510000)摘要 物联网的出现及发展标志着大数据时代已经来临,大数据已渗透到我们生活的各个领域,引领并且改变着我们现有的生活方式。大数据不断地从多样化的物联网传感设备和应用系统中产生,并且将会以更多、更复杂、更多样化的方式持续增长。大数据的复杂化和格式多样化,决定了物联网服务平台中针对大数据的服务场景和类型的多样化,从而要求物联网服务平台必须融合大数据技术来应对。关键词 物联网;大数据; Hadoo
2、p ;Spark中图分类号TN915 文献标识码A 文章编号1008-5599(2016)02-0008-06收稿日期: 2015-10-281 研究背景1.1 物联网催生了大数据随着物联网的蓬勃发展,各种跨行业、领域的感知设备、终端能够快速接入网络并汇聚在一起。物联网世界中大量的传感器将物质世界中形形色色的信息转换成电信号后通过各类网络传送到上层应用系统,可以预见一种趋势已经形成,那就是海量的非结构化数据将急速增长。这些数据量的增长并非是线性的,而是随着越来越多的传感器的研发、制造、投产,数据量会呈现指数性的增长,这种趋势是不可阻挡的。1.2 大数据丰富了物联网应用大数据时代下的物联网, 使
3、得大数据价值得以体现。在物联网技术的应用中, 通过构建智能建筑、数字化医疗、遥感勘测、智能运输、环境监测保护等手段 , 可以通过大数据的收集, 通过云计算技术分析数据 , 把有用的数据挖掘出来形成有用的信息, 从而创造价值。 世界顶级汽车公司 , 正在使用的一项遥感技术 , 有效识别车主身份, 避免豪车的被盗 , 有效记忆识别开车人的驾姿 , 判断驾驶员是否在集中精神开车, 有效避免交通事故的发生。该技术通过对汽车座椅安装一个传感器 , 记忆车主的重量、 正常驾驶的受力点以及相关的关键指标 , 识别车主身份 , 一旦驾驶员跟原有的数据不吻合 , 汽车防盗系统会自动识别出危险, 并且自动通过无线
4、技术把信息反馈到车主, 使得车主可以及时作出相应的处理方式。大数据分析技术的发展和运用 , 使得各类物联网应用更加丰富多彩。2 大数据技术在物联网服务平台应用的必要性2.1 广东移动物联网服务平台的数据特点笔者负责建设的广东移动物联网服务平台是一个基名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 6 页 - - - - - - - - - 9大数据与物联网专题 电信工程技术与标准化2016 年2月 第 2 期(第29卷 总第221 期)月刊2016 年 第2期于 GPRS
5、 企业接 入网络的网元、接口信令数据以及 BOSS中的计费数据等,设计开发出行业客户需要的服务组件,以开放、灵活的 API 接口方式向行业客户提供物联网服务的平台。目前平台每天接入数据量为1TB左右,数据量庞大,接口种类繁多,主要包括如下。(1) 信令监测平台接口 :通过 FTP 获取专用 APN卡、CMNet通道卡的网络信令数据,包括 2G/3G 卡信令数据 (GN-CDR 、用户行为CDR 及TCP 建链 CDR 等 ) 、4G卡信令数据 (MME_CDR、HTTP_CDR、RTSP_CDR、VOIP_CDR 等 ) 。(2)ESB系统接口 :通过 FTP 、Webservice方式与接入
6、 ESB的话音网管、数据网管及资源管理系统对接,接入网元的网络性能数据, 包括 2G/3G 网元 (BSC 、SGSN 、GGSN) 、4G网 元 (eNode B、 MME 、 SGW 、 PGW) ,用户在 HLR 中的 APN 配置信息、用户实时的开关机信息以及 2G/3G/4G基站的位置信息。(3)BOSS接口 :通过 FTP 获取物联网卡的业务订购数据,包括集团信息、产品信息及成员订购信息。(4)BI 系统接口 :通过 FTP 获取 2G/3G/4G物联卡日流量信息。(5)专网专号接口:通过 WebService 获取专网专号的网络数据以及业务状态数据。 2.2 平台引入大数据技术的
7、必要性平台中数据的复杂性使得加快引入大数据技术已经刻不容缓。针对海量数据的特点,虽然数据资源非常重要,但其中的数据信息很大程度上是冗余的,需要对数据进行清洗压缩 ; 再者,颗粒化、非结构化也是物联网中大数据的特点,尽管这种特性的数据处理起来非常复杂,然而它们对数据的使用者来说至关重要,因此,解析非结构数据也是不可忽视的重要环节。鉴于这些因素, 非常有必要引入大数据技术, 通过统一的架构设计,将非结构化的数据变得结构化,将不同系统之间不同结构的数据尽可能地统一,从而使数据信息发挥更大的价值。2.3 大数据技术的选型物联网服务平台数据处理的流程包括采集,导入预处理,数据清洗与计算( 提取、转换和加
8、载) ,存储和管理数据,数据统计分析,利用数据等阶段。通过FTP接口聚集的信令数据、行业数据等更多的是非结构化文档,需要引入的大数据平台和技术,如分布式文件系统、分布式计算框架、非SQL 数据、流计算技术等,通过这些技术可以加强非结构数据的处理和集聚。技术选型如图 1 所示。3 物联网服务平台大数据处理3.1 总体架构通常认为物联网包含信息感知、传递和处理这3 个基本要素,相应地,物联网架构也包含感知层、网络层和应用层3 个基本层次。感知层利用传感器(网)、RFID 等手段来实现信息采集和标识;网络层利用现有的移动网、互联网或其它专用网,对采集来的信息进行传输和基础处理,并提供公共管理服务;应
9、用层对所感知的信息进行智能处理和决策后,实现各类应用服务。物联网服务平台属于应用层,其内外部数据的集成统一需要两种数据(结构化、非结构化)和两种技术平台(关系型数据库、大数据平台)的巧妙融合,从而向上层应用提供物联网服务,达到可运营、可管理的效果,使各种资源相互配合,实现效能最大化。整体架构设计如图图1 物联网平台大数据技术选型名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 6 页 - - - - - - - - - 102016 年2月 第 2 期(第29卷 总第221
10、 期)月刊2016 年 第2期电信工程技术与标准化大数据与物联网专题2 所示。3.2 数据流组成物联网服务平台数据分析基础框架自数据源从下往上分为数据集成层、文件存储层、编程模型层、数据存储层以及数据分析层 5 层。数据流组成如下。(1)数据采集与导入 : 。(2)数据清洗与计算 :实时分析、离线分析。(3) 数 据 分 析 与 统 计 :列 存 储数 据 分析 3.3 数据技术应用说明(1)采用 Hadoop 分布式文件系统 HDFS 对非结构化数据进行存储。 (2)采用 Hbase/Hive对半结构化数据进行存储。 (3)采用 Oracle/Redis 对结构化数据分析结果进行存储 / 缓
11、存。 (4)采用 Zookeeper 作为分布式协调系统。(5) 采 用 Apache Flume-NG导入 离 线数 据 到Hadoop 分布式文件系统 HDFS 。 (6)采用 Storm/Apache Kafka 进行实时数据处理。 (7)采用 Apache Spark进行离线数据处理。 (8)采用 SparkSQL/HiveOnSpark进行大数据统计分析。4 大数据技术应用场景4.1 数据导入预处理由于采集数据的速度和数据处理的速度不一定同步,故不同方式接入的数据应利用不同的技术导入。对于实时的数据流数据,现有的消息(队列)系统能够很好的导入,但存在未及时处理的数据不会写到磁盘上,需
12、要缓存在内存的问题。Kafka 正是为了解决以上问题而设计,它能够很好地支持在线应用。采集完成后,由集成子系统预处理导入到消息中间件, Kafka 利用可靠高效的消息递送机制帮助分布式系统进行平台数据交换。对于离线处理的文件则由Apache Flume-NG将需要离线分析的文件数据写入Hadoop 的分布式文件系统 (HDFS)。Flume NG是一个分布式、可靠、可用的系统,它能够将不同数据源的海量数据进行高效收集、聚合、移动,最后存储到一个中心化数据存储系统中。Flume-NG中的 Hdfs Sink的路径名(对应参数hdfs.path,不允许为空)以及文件前缀(对应参数hdfs.file
13、Prefix)支持正则解析,时间戳自动按时间创建目录及文件前缀。采集到Hdfs 中后,能有对应的文件名,方便后续分析。4.2 数据清洗与计算由于数据源是由不同的系统定义,存在于不同的使用环境,来源于这些数据源的数据存在许多不一致的情形,所以在物联网服务平台数据集市构建的过程中,需要对这些不一致或错误的数据进行转换和清洗,以提高数据的质量。数据清洗的过程是从大量原始数据中使用一系列逻辑判断,检查数据是否是符合数据集市的数据,从而选择做进一步保留或过滤的动作。物联网服务平台根据数据的时效性,分两种清洗与计算模型:实时分析与离线分析。图2 物联网平台大数据处理总体架构名师资料总结 - - -精品资料
14、欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 6 页 - - - - - - - - - 11大数据与物联网专题 电信工程技术与标准化2016 年2月 第 2 期(第29卷 总第221 期)月刊2016 年 第2期实时分析主要处理同步频率比较小的数据,比如同步信令系统的网络数据,每5min 同步一个数据文件,需要用流计算框架进行持续处理。Storm 是 Twitter的开源分布式流计算平台。 Storm通过简单的 API 可以可靠地处理无界持续的流数据,进行实时分析、持续计算、ETL 处理等。 Sto
15、rm 集群有两种节点 :主节点 (Master)和工作节点 (Worker) 。主节点运行一个称之为Nimbus的后台程序, Nimbus 负责在集群范围内分发代码、为Worker 分配任务和监测故障。每个工作者节点运行一个称为 Supervisor 的后台程序,监听分配给它所在机器的工作,基于 Nimbus 分配给它的事情来决定启动或停止工作者进程。 Nimbus和 Supervisor 之间所有的协调工作是通过Zookeeper 集群来进行的。物联网服务平台使用 Storm 实时分析信令文件数据,抽取出用户快照数据存储到 Redis 内存数据库,同时把网络轨迹数据保存到 Hbase 。相应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年大数据技术在物联网服务平台中的应用 2022 数据 技术 联网 服务 平台 中的 应用
限制150内