阿里云智能运维的自动化三剑客.docx
《阿里云智能运维的自动化三剑客.docx》由会员分享,可在线阅读,更多相关《阿里云智能运维的自动化三剑客.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、阿里云智能运维的自动化三剑客整理|王银出品|AI科技大本营ID:rgznai100近日2019AI开发者大会在北京举行。会上近百位中美顶尖AI专家、知名企业代表和千余名AI开发者进展技术解读以及产业论证。而在AIDevOps论坛上阿里巴巴高级技术专家滕圣波就阿里云与智能运维的开展之路对智能运维自动化三剑客弹性伸缩、资源编排以及运维编排进展了重点介绍。在介绍自动化三剑客之前滕圣波为我们讲述了阿里的上云路以及智能运维的开展策略。以双十一为例阿里集团的业务量往年度只有60%70%承载在阿里云上而今年度将百分之百跑在公有云上。这意味着阿里云就是整个阿里集团的运维将创立机器、计算力、存储、网络以及管理机
2、器及数据库这些本质上都是运维的要做的事进展代码化以及自动化。由此可见阿里云已经成为阿里集团的技术底座。滕圣波还表示将来阿里云集团的技术输出只通过阿里云并且技术全面开放进而到达集团以及生态分享促进互联网生态开展。既然阿里云担当了整个集团的运维一角色那传统运维人员又该何去何从这本质上也是DevOps的问题。滕圣波以这么一个场景为例给出答案半夜有一个严重告警目前的机制是系统一旦出现异常就会把相关开发或者负责人叫起来。这意味着截至目前人工职守无可防止。但是阿里云的目的是无人职守毕竟一周连续四次都被凌晨叫起来去处理告警身体是吃不消的。想象一下一个运维人员半夜起来看日志、采取动作动作是什么无非就是机器不够
3、用了、代码多了、负载多了假如加机器加资源解决不了就回滚代码。这些肯定都是可以自动化的顺势而为人工智能必成开展打破口。我们都知道阿里云有SLA而所有都是从架构出发的但是架构不仅仅是阿里云的事情也是客户的事情。一个架构是针对容量规划的针对万人的架构以及针对亿人的架构一定是不一样的。众所周知企业都不是一开场就走到亿人这个步骤而是从万人渐渐成长起来的。企业成长经过中需要不断调整自己的架构以及运维。所以无人职守并不只是阿里云的职责也是客户的职责。简言之“从运维到SRE无人值守是目的自动化是无人值守的手段而人工智能又是自动化的手段之一。其中无人值守的最后一公里由客户侧运维开发。而后滕圣波为我们重点介绍了自
4、动化三剑客。第一便是弹性伸缩即基于AI预测的弹性伸缩。原有监控指标形式监控指标变化敏感引起实例数量震荡扩、缩容操作以及业务变化存在延迟智能预测形式可以做到预测业务变化智能调整实例数量结合目的追踪形式完美贴合业务变化可以最大程度地节省本钱。我们知道大多数公司的业务都是有流量曲线的有顶峰、有低谷那对应的业务承载才能怎样得知好比双十一阿里云在双十一有庞大体量它所承载的业务量一定是在双十一之前按照顶峰就计算好的。但是这有什么问题比方双十一之前阿里云有预估通过全链路的压力测试知道需要准备多少资源但是问题也来了我们要提取多久准备这个资源这是个本钱的问题资源是很贵的假如我们提早个月准备资源可能就多几亿元的本
5、钱负担在上面假如我们可以提早小时准备这个资源那我就可能节省出来很多资源。越可以灵敏地准备自己的资源就越可以省钱省钱极致到什么程度最多能省多少钱如下图容量上限以及曲线之间的面积是我们最多能省的钱这是弹性伸缩最大的价值。可惜理想很饱满现实很骨感。弹性伸缩很难把所有的本钱都省出来。弹性伸缩详细是怎么应用的以下用两个例子来讲明。先看上面这张图从技术角度分析为什么会出这个问题。首先发生的事情是一大堆狂点赞这两个人的粉丝量加起来是宏大的。假如这些粉丝只狂点赞还好赞就是数据库里多一条消息多一条数据记录。赞并不难难的是转发。转发这个事情太恐惧了它不仅仅是克隆在数据库里多几条记录。转发造成了更多消息流推送消息量
6、瞬间几何倍增。比方一开场100万人看到这个消息里面有10万人转发迅速在整个网络里造成了大量消息挤占了大量网络造成了大量数据库写操作。读不可怕因为读的话可以做分级、可以做CDN但写这个东西太夸大了写是必须真实的往数据库里做操作的。而且数据库当时有大量的缓存而写不是缓存的特点所以一下子就被打穿接着就成为数据库的负担了。在疯狂写数据的时候数据库突然崩了那么效劳就会限流。但限流对于很多用户来讲是不可承受的他会认为是效劳宕掉了。这时候我们就可以用弹性伸缩去解决。有两个思路一个是一定要快快是什么概念大众看看基于监控逐步转化的预测有很多都是基于监控指标的算法。当你的曲线已经开场往上走时监控一定是第一时间能发
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 阿里 智能 自动化 剑客
限制150内