《网站服务器分析方法.pptx》由会员分享,可在线阅读,更多相关《网站服务器分析方法.pptx(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、目录什么是服务器日志什么是服务器日志1读懂服务器日志读懂服务器日志2服务器服务器日志分析工具日志分析工具3分析日志发现并解决问题分析日志发现并解决问题4想一想航空飞行记录器可以记录飞行数据用于空难或者事故分析如果网站的数据分析应该怎么做?大家知道飞机黑匣子的作用吗?大家知道飞机黑匣子的作用吗?提问提问提问提问什么是服务器日志什么是服务器日志服务器日志的定义服务器日志的作用服务器日志的获取服务器日志的定义服务器日志记录服务器接收客户端处理请求,并记录服务器对这条请求处理结果以.log结尾的文件。服务器日志是服务器自动生成的,一般以日期命名可以用记事本直接打开查看服务器日志的定义独立服务器和虚拟空
2、间配置查找服务器日志的方式不一样,我们以西部数码虚拟空间为例Apache日志Linux系统服务器日志iis日志Windows系统服务器日志服务器日志的作用服务器日志的作用了解搜索引擎抓取网页的相关数据到访抓取等数据了解网站内容及链接是否正常http状态码及爬行收录情况对网站维护有非常重要的指导作用根据蜘蛛爬行的频率等,判断蜘蛛喜好及文章质量的高低服务器日志的获取不同空间存放不一样,我们以西部数码Linux为例服务器日志的获取不同空间存放不一样,我们以西部数码windows为例小结服务器日志的定义服务器日志的作用服务器日志的获取读懂服务器日志读懂服务器日志读懂Apache日志读懂iis日志读懂A
3、pache日志服务器日志分条读取(用写字板打开)读懂Apache日志服务器日志读取重点访问时间 被访问的文件地址搜索引擎蜘蛛或者用户浏览器访问者的IP访问状态码读懂Apache日志服务器日志读取61.139.126.228-26/Sep/2013:16:14:37+0800 POST/install/index.php HTTP/1.0 200 352 http:/ Mozilla/5.0(Windows NT 5.1)AppleWebKit/537.36(KHTML,like Gecko)Chrome/28.0.1500.72 Safari/537.362013年9月26日用户通过/inst
4、all/index.php页面成功提交了信息(这个是网站程序安装信息)练一练IP为61.139.126.228的用户通过Chrome浏览器成功访问了/include/vdimgck.php这个网页61.139.126.228-26/Sep/2013:16:23:32+0800“GET/include/vdimgck.php HTTP/1.0”200 1626“http:/ NT 5.1)AppleWebKit/537.36(KHTML,like Gecko)Chrome/28.0.1500.72 Safari/537.36”提问提问提问提问读懂iis日志iis日志读取#Fields:date
5、time cs-method cs-uri-stem cs-username c-ip cs-version cs(User-Agent)cs(Referer)sc-status sc-substatus sc-bytes读懂iis日志日志相关拓展date表示记录访问日期;time访问时间;cs-method表示访问方法常见的有两种,一是GET,就是平常我们打开一个URL访问的动作二是POST,提交表单时的动作;cs-uri-stem就是访问哪一个文件资源;cs-username访问者名称 c-ip客户端ip cs-version客户端协议版本 HTTP/1.0 HTTP/1.1 读懂iis日
6、志日志相关拓展cs(User-Agent)用户代理可以分辨是用户还是搜索引擎的蜘蛛cs(Referer)引用页网址sc-status状态200表示成功301永久重定向403表示没有权限404表示打不到该页面500内部服务器错误;503服务器超时sc-substatus协议子状态sc-bytes服务端传送到客户端的字节大小读懂iis日志1*:请求收到,需要继续处理 2*:请求已成功被服务器接收、理解、并接受200:请求已成功,请求所希望的响应头或数据体将随此响应返回(可以正常浏览网页)3*:完成此请求需要客户端进一步处理 301:永久重定向,被请求的资源已永久移动到新位置4*:请求包含错误语法或
7、不能完成(客户端错误)404找不到文件5*:服务器执行有效请求失败(服务器错误)500内部服务器错误503服务器超时读懂iis日志iis日志读取2013-09-24 16:20:53 GET/plus/guestbook.php-220.181.108.173 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;+http:/ 0 7351在2013年09月24日IP为220.181.108.173的百度蜘蛛来爬行/plus/guestbook.php成功。读懂iis日志iis日志读取2013-09-24 16:27:50 GET/sure/Mi
8、ssiveShow.asp-66.249.74.134 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;+http:/ 0 1468在2013年09月24日IP为66.249.74.134的谷歌蜘蛛未找到/sure/MissiveShow.asp网页。练一练2013-09-24 日IP为220.181.108.159的百度蜘蛛成功访问了/plus/guestbook.php这个网页2013-09-24 17:54:26 GET/plus/guestbook.php-220.181.108.159 HTTP/1.1 Mozilla/5.0+(com
9、patible;+Baiduspider/2.0;+http:/ 0 7351提问提问提问提问读懂iis日志其中c-ip可以查询对方运行中输入nslookup可以查询DNS信息小结读懂Apache日志读懂iis日志服务器服务器日志分析工具日志分析工具光年SEO日志分析系统V2.0功能:能分析多种格式日志文件,分析结果形成htm格式的网页,服务器服务器日志分析工具日志分析工具光年SEO日志分析系统V2.0优点:针对SEO数据分析设计,分析维度较其他软件更有针对性快读分析较大的日志文件,每小时分析40G左右的日志文件能自动判断日志格式软件容量小(1M多)、操作简单、绿色免安装版缺点:日志分析的维度
10、还太少数据分析准确度有待提高服务器服务器日志分析工具日志分析工具光年SEO日志分析系统V2.0使用方法:服务器服务器日志分析工具日志分析工具光年SEO日志分析系统V2.0分析方法:可以看单个日志文件数据,也可以对比连日数据进行分析重点数据:概要分析:目标蜘蛛访问次数、停留时间、抓取量;对应问题:1.访问次数少、2.抓取量少服务器服务器日志分析工具日志分析工具光年SEO日志分析系统V2.0重点数据:目录抓取:分析网站文件夹的爬取量情况对应问题:3.文件夹爬取量低(对应更新量判断)页面抓取:分析页面是否被抓取及抓取量对应问题:4.页面未被抓取或被抓取的页面较少,5.隐私文件被抓取服务器服务器日志分
11、析工具日志分析工具光年SEO日志分析系统V2.0重点数据:目录抓取:分析网站返回码是否正确对应问题:6.修正返回错误的页面如有返回404则需要检查对应文件是丢失还是特意删除,丢失则需要补上,特意删除的则删除相应链接。分析日志发现并解决问题分析日志发现并解决问题1.访问次数少2.抓取量少3.文件夹爬取量低4.页面未被抓取或被抓取的页面数较少(数量非次数)5.隐私文件被抓取6.修正返回错误的页面分析日志发现并解决问题分析日志发现并解决问题1.访问次数少增加外链、更新时间规律2.抓取量少增加文章质量,坚持更新,内部优化做内链3.文件夹爬取量低内部优化,做好内链优化4.页面未被抓取或被抓取的页面数较少(数量非次数)提高文章质量,做好内链优化5.隐私文件被抓取采用robots.txt或者robots meta标签等限制文件的抓取6.修正返回错误的页面检查相关文件或服务器问题(异常时需要关注,情况较少)返回404的文件要查询是否需要补上文件总结什么是服务器日志读懂服务器日志服务器日志分析工具光年SEO日志分析系统V2.0分析日志发现并解决问题
限制150内