2022年阿里云-云监控用户手册 .pdf
《2022年阿里云-云监控用户手册 .pdf》由会员分享,可在线阅读,更多相关《2022年阿里云-云监控用户手册 .pdf(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、云监控用户手册 Version: 0.1 一、 概览在概览页面中展示中系统默认提供的监控项或者用户创建的监控项、用户创建的监控点、云服务的实例数、用户设置的报警规则等。1.1 名词解释先介绍下云监控三个核心的概念。【监控项】:用户设置或者系统默认的监控数据类型,例如站点监控的Http 监控 默认有两个监控项http.responseTime & http.status。ECS的监控项有CPU 利用率、内存利用率等等。【监控点】:某一实例绑定到具体的一个监控项即为一个监控点。如针对这个站点的http 监控,实际包含两个监控点http.response & http.status。对于 ECS云主
2、机有 11 个监控项,所以一台云主机默认有11 个监控点【报警规则】:用户在监控点上设置规则,当满足条件时会触发报警名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 27 页 - - - - - - - - - 1.2 短信使用情况云监控默认为每位用户提供1000 条免费的报警短信。在概览中,用户可以查看已经使用的短信数。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -
3、 第 2 页,共 27 页 - - - - - - - - - 二、 站点监控站点监控可以对目标站点服务的可用性以及响应时间进行监控。系统已经默认预置了8 种监控类型,包括http监控、 ping 监控、 tcp 监控、 udp 监控、 DNS 监控、 pop 监控、 smtp监控、 ftp 监控。其中每种监控类型里面包含了两个监控项:status 和responsetime。监控类型简介HTTP监控监控 Web站点中任何指定的URL ,获得可用性监控以及响应时间。Ping 监控对指定的服务器进行ICMP Ping检测,获得可用性监控以及响应时间、丢包率等。TCP端口监控监控服务器TCP端口的
4、可用性和响应时间。UDP端口监控监控服务器UDP端口的可用性和响应时间。DNS监控监控域名的可用性和响应时间,并获得各种域名记录列表,支持域名轮询(RR)。POP3监控监控 POP3服务器的可用性和响应时间。SMTP监控监控 SMTP服务器的可用性和响应时间。FTP监控监控 FTP服务器的可用性和响应时间。1. 点击页面右上角的“创建监控点”按钮,进入“站点监控”类型选择页面;单击列表页面的某一行,可以显示缩略图,可用性缩略表显示的是一天内的可用性展示,响应时间缩略图展示的是近1 小时内的响应时间曲线,不代表当前状态。可用性和响应时间缩略图均是统计数据,不代表监控站点的最新状态。名师资料总结
5、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 27 页 - - - - - - - - - 2. 选择您要创建的“监控类型”,点击某一“监控类型”链接进入监控点创建页面;3.进入创建监控点的表单页面;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 27 页 - - - - - - - - - 4.创建监控点表单描述1)监控点名称:为您的监控点输入个性化的名称2)
6、监控地址:您要监控的地址,对http来说,就是一个网站的地地址,对域名解析来说,就是某一个域名等等。3)上报频率:站点监控探测引擎多长时间执行一次探测任务,并上报数据的频率。默认为5 分钟,请谨慎选择1 分钟,过于频繁的探测可能会导致对方服务屏蔽您的账号。4)分页式监测点,目前我们部署了两个监测点,可以分别从杭州和青岛对您设置的目标服务进行监测,您也可以只选择从其中一个监测点进行探测。后续会支持更多监测点,包括海外的监测点。5)高级设置,不同的监控类型会有一些高级选项a.http监控:i.请求方法, http标准的请求方法,getposthead,其中post支持提交内容。ii.提交内容,只对
7、post请求方法有效,输入您的目标服务能够识别的内容。iii.匹配响应内容,您期望探测目标网站返回什么样的内容。iv.匹配方式: 选择匹配,则如果网站返回内容匹配您期望的内容报警;选择不匹配,则如果网站返回内容不匹配您期望的内容报警。v.Cookie :您期望探测目标网站需要的cookie , key:value形式,多个cookie以半角分号分隔。vi.http请求头信息:您期望探测目标网站需要的http header信息, key:value形式,多个header以半角分号分隔。1.http验证用户名:2.http验证密码:b.ping监控:您可以使用ping 监控服务来检测目标服务的网络
8、延迟。c.Tcp 监控:监控地址的端口是不是连通的。另外,您也可以配置请求内容和期望的响应内容。如果配置了这两项内容,则不匹配时会报警。内容支持 16 进制字节码和文本两种形式,i.16 进制字节码。如:0 xcf,0 x0f,0 x85,0 x85ii.文本。系统内容会对文本内容进行转换,请注意空格等容易出错的字符。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 27 页 - - - - - - - - - d.Udp 监控:监控某地址的udp 服务,因为udp 协议的
9、特性,必须要为udp配置请求和响应内容,否则udp 探测将永远成功。i.16 进制字节码。如:0 xcf,0 x0f,0 x85,0 x85ii.文本。系统内容会对文本内容进行转换,请注意空格、换行符等容易出错的字符。e.DNS监控: 监控域名的可用性和响应时间,并获得各种域名记录列表,支持域名轮询(RR)。通常只需要默认选择查询类型A.f.POP 监控:监控POP3 协议的接收邮件服务器,填写正确的地址、端口,如果配置用户名密码,则会验证用户名密码。请注意频率,如果频率太快,有可能会导致对方服务屏蔽您的账号。请依据对方服务选择是否使用完全连接。g.Smtp监控:监控SMTP 协议的发送邮件服
10、务器,填写正确的地址、端口,如果配置用户名密码,则会验证用户名密码。请注意频率,如果频率太快,有可能会导致对方服务屏蔽您的账号。请依据对方服务选择是否使用完全连接。h.ftp 监控:验证Ftp 服务是否正常以及延迟情况。6)约定:a.每个创建成功的监控点会形式两个监控指标,一个是状态,一个是响应时间。对所有的状态来说,我们约定,小于400的状态码为正常(对需要匹配内容的服务,如果服务状态正常,但内容不匹配,我们也认为是不正常。),大于等于400的状态为异常(有可能是服务响应内容不匹配您预置的期望值)。b.响应时间单位是毫秒。c.对于可用性图表,每小时计算一次。d.对于ping监控,目前没有可用
11、性统计,我们展示的是某统计周期内的丢包率和响应时间的平均值统计。e.监控点创建成功后,站点监控后台会启动相应的探测任务,按您指定的频率探测并上报数据给云监控后台,进行分析和报警服务。7)监控点创建成功会,会自动跳转到创建报警规则页面:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 27 页 - - - - - - - - - 创建报警规则表单详细描述:1)统计周期:后台会依据统计周期形成统计报表,2)重试几次报警:您可以选择连续几次超过阀值报警,默认是三次,通常偶然因素会
12、导致状态不对或者服务响应超时,连续三次以上更能代表服务工作不正常,减少误报的情况。3)响应时间的报警阀值:服务响应时间超过这个阀值,则会报警。4)报警的接收组(人):参照报警管理部分的文档。创建成功的监控点会进入列表页面名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 27 页 - - - - - - - - - a.查看详情:查看该监控点的当前的详情状态。b.报警规则修改:修改报警规则c.修改:修改监控点d.删除:会删除当前监控点以及监控点关联的报警规则。e.采样点 :当
13、前监控状态,列表页面的监控状态显示的是最新一条监控数据的状态。及时性很高。代表该目标服务的最新状态。1)点击查看详情,进入详情页面:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 27 页 - - - - - - - - - 可以查看到 今日、昨日、近7 天、近 15 天、近 1月的监控数据情况。描述:站点监控的详情页面共有两个tab 页面, 分别是显示可用性图表和响应时间的变化曲线。可用性展示的是按小时统计的可用性比例。计算规则如下:成功状态的数据总数/上报数据总数=
14、可用性比率。假定用户设定的上报频率为1 分钟,则每小时共有60 次数据上报,其中2 条不成功,则在当前的这一小时内的可用性为58/60=96.7。响应时间展示的数据统计周期,随查询的时间段不同而不同,今天和昨天两个时间段,查询的是5 分钟内的平均值。7 天及以上,查询的是1 小时内的平均值。所以, 图表展示的监控状态会有延迟,有可能和监控点列表页面的状态不一致,该图表仅作统计展示用,不代表监控点的当前状态。2)点击报警详情,可以查看报警的详情,包括概述,通知历史,报警的状态变化,操作历史。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - -
15、- - 名师精心整理 - - - - - - - 第 9 页,共 27 页 - - - - - - - - - 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 27 页 - - - - - - - - - 三、 云服务监控云服务监控是阿里云为用户提供的各种云产品的监控,包括ECS, RDS, OCS, OTS, OSS 等,当前对用户开放的只有ECS云主机的监控,其它云产品的监控会陆续加入进来,尽请期待。3.1 云服务器监控ECS 监控主要涵盖的指标有CPU 利用率、内
16、存利用率、磁盘利用率、磁盘读写、网络速率,系统平均负载(仅限Linux 主机)、进程数、TCP 连接数等。进入云监控的控制台后,点击【云服务监控】标签,即可进入ECS云服务器监控。如下图所示:首页中,罗列出用户的机器列表。对于每一台云主机,默认展示的有实例 ID、操作系统类型、机器IP、CPU利用率、内存利用率、操作等。这里 CPU 利用率与内存利用率是最新的监控数据展示。3.1.1 查看明细【ECS云服务器】【查看明细】,可看到此云主机所有的监控指标情况。点击查看明细:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整
17、理 - - - - - - - 第 11 页,共 27 页 - - - - - - - - - 明细指标页面:可以查看到 今日、昨日、近7 天、近 15 天、近 1月的监控数据情况。说明: 对于系统为linux的主机,磁盘IO 的监控数据获取是通过iostat进行的;若您发现 Linux 主机无磁盘IO 数据,请确认您的机器是否安装了iostat 指令。 Redhat与CentOS用户可以使用yum 进行安装; Ubuntu与 Debian用户可以使用apt-get进行安装。3.1.2 ECS 云主机报警管理在【查看明细】的页面的下端,有针对这台云主机报警规则的管理页面,如下图:名师资料总结
18、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 27 页 - - - - - - - - - 用户可以在这里新增报警、修改报警、暂停报警、删除报警、查看报警历史详情。3.1.2.1 新增报警名词解释:【监控项】:云主机采集的监控数据指标,如CPU 利用率、内存利用率等名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 27 页 - - - - - - - - -
19、【统计周期】:监控数据的聚合周期,如采集周期是1 分钟一次,统计周期可以是5 分钟、 1 小时等, ECS的统计周期是固定的,不需要用户设置,但在报警设置这里,用户可以选择对采集的原始数据(1 分钟 1 次)进行报警设置,也可以选择对统计的结果进行报警设置【统计方法】:默认有五种统计方式,最大值、最小值、平均值、求和值、采样计数值 。特别说明下,采样计数值,是指在统计周期内,上报的监控数据条数。阈值目前数值型。【重试几次后报警】:是指当监控数据连续几次满足用户设置的规则后,才进行报警。主要目的是避免监控数据的抖动。【联系人通知组】:满足报警条件后,通知给哪些联系人。具体的概念介绍请参考第一部分
20、, 用户信息管理3.1.2.2 暂停报警用户可以选择关闭或者打开报警3.1.2.3 报警详情点击详情按钮进入下图展示的页面,包含概述、通知历史、状态变化、操作历史。概述:用户针对当前实例某一监控项设置的报警规则通知历史:在满足用户设置的报警规则时,会进行报警;当恢复正常后,亦会通知用户。这里需要介绍下通道沉默 这一概念,当某一条报警发出后,在1 天内若再次触发报警,不会通知,恢复正常的通知不会受沉默期的影响。当前系统默认的沉默期是1 天,在后面的版本会将沉默期的设置开放给用户。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年阿里云-云监控用户手册 2022 阿里 监控 用户手册
限制150内