linux系统性能优化与瓶颈分析.doc
《linux系统性能优化与瓶颈分析.doc》由会员分享,可在线阅读,更多相关《linux系统性能优化与瓶颈分析.doc(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、linux系统性能优化与瓶颈分析一,用vmstat分析系统I/O情况rootlocalhost # vmstat -n 3 (每个3秒刷新一次)procs-memory-swap- -io- -system- -cpu-r b swpd free buff cache si so bi bo in cs us sy id wa1 0 144 186164 105252 2386848 0 0 18 166 83 2 48 21 31 02 0 144 189620 105252 2386848 0 0 0 177 1039 1210 34 10 56 00 0 144 214324 10525
2、2 2386848 0 0 0 10 1071 670 32 5 63 00 0 144 202212 105252 2386848 0 0 0 189 1035 558 20 3 77 02 0 144 158772 105252 2386848 0 0 0 203 1065 2832 70 14 15 0IO-bi:从块设备读入的数据总量(读磁盘)(KB/S)-bo:写入到块设备的数据总量(写磁盘)(KB/S)随机磁盘读写的时候,这2个值越大(如超出1M),能看到CPU在IO等待的值也会越大二,用iostat分析I/O子系统情况 如果你的系统没有iostat,sar,mpstat等命令,安
3、装sysstat- 7.0.2-1.el5.i386.rpm包,iostat工具将对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU 使用情况。同vmstat一样,iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。iostat的语法如下:程序代码iostat -c | -d -k -t -V -x device interval count -c为汇报CPU的使用情况;-d为汇报磁盘的使用情况;-k表示每秒按kilobytes字节显示数据;-t为打印汇报的时间;-v表示打印出版本信息和用法;-x device指定要统计的设备
4、名称,默认为所有的设备;interval指每次统计间隔的时间;count指按照这个时间间隔统计的次数。iostat在核2.4和核2.6中数据来源不太一样,对于kernel 2.4, iostat 的数据的主要来源是 /proc/partitions;在2.6中,数据来源主要是/proc/diskstats和/sys/block/sd*/stat这两个文件#cat /proc/diskstats | grep sda 8 0 sda 17945521 1547188 466667211 174042714 15853874 42776252 469241932 2406054445 0 1376
5、55809 25809604228 1 sda1 936 1876 6 128 2 sda2 19489178 466659986 58655070 4692402248 3 sda3 1270 1441 33 2648 4 sda4 4 8 0 08 5 sda5 648 1442 0 08 6 sda6 648 1442 0 0第1列 : 磁盘主设备号(major)第2列 : 磁盘次设备号(minor)第3列 : 磁盘的设备名(name)第4列 : 读请求总数(rio)第5列 : 合并的读请求总数(rmerge)第6列 : 读扇区总数(rsect)第7列 : 读数据花费的时间,单位是ms.
6、(从_make_request到 end_that_request_last)(ruse)第8列 : 写请求总数(wio)第9列 : 合并的写请求总数(wmerge)第10列 : 写扇区总数(wsect)第11列 : 写数据花费的时间,单位是ms. (从_make_request到 end_that_request_last)(wuse)第12列 : 现在正在进行的I/O数(running),等于I/O队列中请求数第13列 : 系统真正花费在I/O上的时间,除去重复等待时间(aveq)第14列 : 系统在I/O上花费的时间(use)。#iostat -x 1Linux 2.6.18-53.el
7、5PAE (localhost.localdomain) 03/27/2009avg-cpu: %user %nice %system %iowait %steal %idle 30.72 0.00 5.00 5.72 0.00 58.56Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %utilsda 0.79 21.81 9.15 8.08 237.99 239.29 27.69 1.32 76.31 4.07 7.02sdb 0.69 19.13 3.26 2.99 153.08 176.
8、92 52.85 0.43 68.80 5.96 3.72sdc 3.47 89.30 10.95 7.30 213.30 772.94 54.04 1.32 72.43 4.18 7.63每项数据的含义如下,rrqm/s: 每秒进行 merge 的读操作数目。即 rmerge/swrqm/s: 每秒进行 merge 的写操作数目。即 wmerge/sr/s: 每秒完成的读 I/O 设备次数。即 rio/sw/s: 每秒完成的写 I/O 设备次数。即 wio/srsec/s: 每秒读扇区数。即 rsect/swsec/s: 每秒写扇区数。即 wsect/srkB/s: 每秒读K字节数。是 rs
9、ect/s 的一半,因为每扇区大小为512字节。wkB/s: 每秒写K字节数。是 wsect/s 的一半。avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。即 (rsect+wsect)/(rio+wio)avgqu-sz: 平均I/O队列长度。即 aveq/1000 (因为aveq的单位为毫秒)。await: 平均每次设备I/O操作的等待时间 (毫秒)。即 (ruse+wuse)/(rio+wio)svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 use/(rio+wio)%util: 一秒中有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间I/O队列是非
10、空的,即use/1000 (因为use的单位为毫秒),如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。svctm 一般要小于 await (因为同时等待的请求的等待时间被重复计算了),svctm 的大小一般和磁盘性能有关,CPU/存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加。await 的大小一般取决于服务时间(svctm) 以与 I/O 队列的长度和 I/O 请求的发出模式。如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响
11、应时间变慢,如果响应时间超过了用户可以容许的围,这时可以考虑更换更快的磁盘,调整核 elevator 算法,优化应用,或者升级 CPU。队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。io/s = r/s +w/sawait=(ruse+wuse)/io(每个请求的等待时间)await*io/s=每秒的I/O请求总共需要等待的msavgqu-sz=await*(r/s+w/s)/1000(队列长度)以下数据其实与/proc/diskstats中除设备号与设备名外的其它数据是一一对应关系,只是统
12、计的方法略有差别而已。#cat /sys/block/sda/stat17949157 1547772 466744707 174070520 15855905 42781288 469298468 2406092114 2 137680700 2581025934三,sar -b 监控I/O#sar -b 1 10Linux 2.6.18-53.el5PAE (localhost.localdomain) 03/29/200912:19:40 AM tps rtps wtps bread/s bwrtn/s12:19:42 AM 21.48 9.40 12.08 187.92 429.531
13、2:19:43 AM 14.00 14.00 0.00 840.00 0.0012:19:44 AM 10.29 8.82 1.47 235.29 217.6512:19:45 AM 12.87 10.89 1.98 752.48 142.5712:19:46 AM 19.82 12.61 7.21 425.23 381.9812:19:47 AM 19.00 19.00 0.00 512.00 0.0012:19:49 AM 9.29 9.29 0.00 262.86 0.0012:19:50 AM 16.00 5.00 11.00 144.00 536.0012:19:51 AM 17.6
14、5 8.82 8.82 211.76 235.2912:19:52 AM 41.41 29.29 12.12 614.14 363.64Average: 17.75 12.30 5.45 397.19 231.99-tps:每秒钟对磁盘发送transfer的总数,一个transfer就是一个I/O,多个逻辑请求组合成一个对磁盘的I/O请求,一个transfer的大小不确定。-rtps:每秒钟的物理读的总数-wtps:每秒钟的物理写的总数-bread/s:每秒钟从磁盘读取的数据总数-bwrtn/s:每秒钟写入磁盘的数据的总数四,sar -d 1 10Linux 2.6.18-53.el5PAE
15、(localhost.localdomain) 03/29/200912:38:56 AM DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util12:38:57 AM dev8-0 15.00 232.00 0.00 15.47 0.01 0.87 0.87 1.3012:38:57 AM dev8-16 6.00 80.00 320.00 66.67 0.05 8.67 8.67 5.2012:38:57 AM dev8-32 10.00 224.00 0.00 22.40 0.09 9.20 9.20 9.20 tps:
16、每秒钟对磁盘发送transfer的总数,一个transfer就是一个I/O,多个逻辑请求组合成一个对磁盘的I/O请求,一个transfer的大小不确定 rd_sec/s每秒钟读取的扇区数,每个扇区512 bytes. wr_sec/s每秒钟写入的扇区数,每个扇区512 bytes. avgrq-sz对磁盘请求的扇区的平均大小。 avgqu-sz对磁盘请求的平均队列长度. await请求响应的平均时间(毫秒).包括在请求队列中的时间和响应消耗时间 svctm对IO请求的服务时间. %utilI/O请求占用的CPU时间百分比。Linux命令-分析存的瓶颈为了提高磁盘存取效率, Linux做了一些精
17、心的设计, 除了对dentry进行缓存(用于VFS,加速文件路径名到inode的转换), 还采取了两种主要Cache方式:Buffer Cache和Page Cache.前者针对磁盘块的读写,后者针对文件inode的读写.这些Cache有效缩短了I/O系统调用(比如 read,write,getdents)的时间. 存活动基本上可以用3个数字来量化:活动虚拟存总量,交换(swapping)率和调页(paging)率.其中第一个数字表明存的总需求 量,后两个数字表示那些存中有多少比例正处在使用之中.目标是减少存活动或增加存量,直到调页率保持在一个可以接受的水平上为止. 活动虚拟存的总量(VM)=
18、实际存大小(size of real memory)(物理存)+使用的交换空间大小(amount of swap space used) 当程序运行需要的存大于物理存时,UNIX系统采用了调页机制,即系统copy一些存中的页面到磁盘上,腾出来空间供进程使用。大多数系统可以忍受偶尔的调页,但是频繁的调页会使系统性能急剧下降。UNIX存管理:UNIX系统通过2种方法进行存管理,“调页算法”,“交换技术”。调页算法是将存中最近不常使用的页面换到磁盘上,把常使用的页面(活动页面)保留在存中供进程使用。交换技术是系统将整个进程,而不是部分页面,全部换到磁盘上。正常情况下,系统会发生一些交换过程。当存严重
19、不足时,系统会频繁使用调页和交换,这增加了磁盘I/O的负载。进一步降低了系统对作业的执行速度,即系统I/O资源问题又会影响到存资源的分配。Unix的虚拟存Unix的虚拟存是一个十分复杂的子系统,它实现了进程间代码与数据共享机制的透明性,并能够分配比系统现有物理存更多的存,某些操作系统的虚存甚至能通过提供缓存功能影响到文件系统的性能,各种风格的UNIX的虚存的实现方式区别很大,但都离不开下面的4个概念。1:实际存实际存是指一个系统中实际存在的物理存,称为RAM。实际存是存储临时数据最快最有效的方式,因此必须尽可能地分配给应用程序,现在的RAM的形式有多种:SIMM、DIMM、Rambus、DDR
20、等,很多RAM都可以使用纠错机制(ECC)。2:交换空间交换空间是专门用于临时存储存的一块磁盘空间,通常在页面调度和交换进程数据时使用,通常推荐交换空间的大小应该是物理存的二到四倍。3:页面调度页面调度是指从磁盘向存传输数据,以与相反的过程,这个过程之所以被称为页面调度,是因为Unix存被平均划分成大小相等的页面;通常页面大小为 4KB和8KB(在Solaris中可以用pagesize命令查看)。当可执行程序开始运行时,它的映象会一页一页地从磁盘中换入,与此类似,当某些 存在一段时间空闲,就可以把它们换出到交换空间中,这样就可以把空闲的RAM交给其他需要它的程序使用。4:交换页面调度通常容易和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- linux 系统 性能 优化 瓶颈 分析
限制150内