支撑系统中全景监控技术研究实现(精品).docx
《支撑系统中全景监控技术研究实现(精品).docx》由会员分享,可在线阅读,更多相关《支撑系统中全景监控技术研究实现(精品).docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、支撑系统中全景监控技术研究实现摘要:本文具体分析了移动应用支撑系统监控技术面临的各类问题,并提出了一种覆盖用户体验、后台系统、底层硬件等各个层面的全景监控技术,实现了移动应用后台支撑系统的统一监控与分析,并通过变点检测等方法及时发现监控数据的阴跌或暗涨等趋势变化。关键词:支撑系统;全景监控;全链路技术;变点检测随着移动互联网的快速发展,各类热门移动应用的后台支撑系统也随着前端应用的业务发展变得愈加强大与复杂,而监控系统在后台支撑中扮演的角色也越来越重要。怎样迅速监控到从用户体验、支撑系统乃至底层硬件的波动或者故障,并迅速定位问题,是移动应用后台监控系统面临的主要问题。1存在的问题通过对业界移动
2、应用后台支撑系统的监控系统进行整理与分析,发现主要存在下面几类问题。1.1用户侧体验缺乏监控用户在使用移动应用中一旦碰到应用闪退、白屏、卡顿、页面加载不完好、页面之间切换慢等问题会发生抱怨、投诉、甚至流失等情况,用户的使用体验和应用的口碑都会遭到较大影响。大部分移动应用的后台监控系统主要关注业务和系统等层面,用户体验的问题主要通过事前测试或者事后客户投诉来发现,缺乏能在用户使用经过中就及时发现批量出现用户体验问题的方案。1.2故障定位效率需提升很多移动应用的后台支撑系统经过一段时间的迭代建设后,功能层面不断完善,但是架构也越来越复杂,给监控系统的故障定位效率提出了新的挑战。比方各系统模块是通过
3、不同项目分期设计和上线,往往都有独立的监控工具如数据库有独立的监控工具,缓存模块有独立的监控工具,但监控的视野较窄且互相无关联,缺乏一致性的监控视角,经常出现各独立监控系统均有预警,系统运维人员却无法判定能否是同一故障引起,排障效率较低。1.3对趋势的预测能力弱传统的监控预警算法中,预警的阈值主要直接取自监控数据本身,但是对于阴跌和暗涨等数据缓慢变化,存在无法及时把控数据变化趋势,存在误报和漏报的可能。2移动应用支撑系统的全景监控技术基于业界移动应用后台支撑系统的监控技术存在缺乏对用户体验的监控、排障效率低、趋势预测能力弱等问题,本文提出了针对移动应用支撑系统的全景监控技术。2.1全景监控架构
4、全景监控在客户端应用层面增加了关于用户体验的监控,比方用户在应用中批量出现的客户端崩溃、白屏、页面切换慢等问题的监控,另外也实现了对应用级系统和底层硬件层面的监控,做到监控点全面分布,监控口径一致。从客户端到应用级系统缓存、中间件等再到底层硬件,信息全面采集,集中收集清洗,实时处理分析,各个层面通过数据流串联起来,统一监控与分析,如图1所示。2.1.1数据采集层以监控目的为维度进行划分,对下面各部分数据进行全面采集。1用户体验数据:利用自研的客户端和H5插码技术,对客户端的APP崩溃、ANR或白屏、H5页面加载慢或者出错等批量影响用户体验的异常情况进行采集。客户端和H5插码是通过在移动应用中集
5、成用户体验采集SDK来实现的,同时在对应的服务端架设Nginx+Lua环境的采集数据接收端,根据约定的格式及间隔时间,采集带时间戳的客户体验数据。详细采集流程如图2所示。本文中提及的用户体验采集SDK的逻辑架构如图3所示。整体上分为3层。最上层是接口层,提供APP调用的方法以及环境和配置参数等。第2层是业务层,包含了客户端各页面测速、卡顿检测和参数采集等所有的核心逻辑。第3层是数据层,将业务层产生的数据封装为统一的数据构造,并保存到本地文件或者数据库中。2应用系统数据:利用自研的Collectframework技术和业界热门的Metricbeat技术,实现对支撑系统中Nginx、缓存、服务中间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 支撑 系统 全景 监控 技术研究 实现 精品
限制150内