AC优化指导手册 .doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《AC优化指导手册 .doc》由会员分享,可在线阅读,更多相关《AC优化指导手册 .doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中国移动浙江公司WLAN AC优化指导手册(V1.0)浙江移动 网优中心2012年7月目 录1.设备问题优化21.1AP假死问题21.2AC频繁重启/宕机问题42.N+1冗余优化52.1 主备AC未能进行正常切换62.2 AP切换异常62.3 用户业务切换异常72.4 CPU负荷异常82.5 切换时间过长83.组网构架优化93.1 单点故障问题93.2 组网问题104.安全问题优化144.1外网恶意攻击144.2 账户安全问题144.3 内网安全145.AC性能优化165.1AC负荷高问题165.2上联链路拥塞问题165.3 AC温度高问题176.用户漫游致计费问题优化187.性能指标优化19
2、7.1 关联成功率低问题197.2 关联拥塞问题201.设备问题优化1.1 AP假死问题AP假死问题分析:AP假死是指AP设备在运行过程中出现的挂起,死机等情况,导致用户WLAN无线上网感知差。AP假死主要表现在:(1) AP闪灯正常,在AC上也显示在线,并无异常告警(2) 现场有信号覆盖,但用户无法关联和获取地址(3) AP宕机或者频繁冷重启(4) 可导致弱覆盖问题,造成信道内过多低网速用户和影藏节点问题出现AP假死的主要原因:(1) 内核崩溃造成的进程挂起(2) AP硬件模块故障(3) 交换机端口POE远供不足或者因网线过长导致AP获取的功耗始终在一个临界阀值徘徊(4) 施工工艺问题场景案
3、例分析:案例一:内核崩溃造成进程挂起导致的AP假死故障描述:某现场人员反映一个AP出现吊死现象,用户在现场无法获取地址。在AC的内核崩溃记录中查找到以下信息:同时在Log日志中,我们也发现了关于内核崩溃问题引起AP假死的相关信息:May 28 09:34:00 ZJSHX-MS-WLAN-AC51-CD %CC-6-APREADOPTREASON: AP 5C-0E-8B-45-4E-9B readoption reason: ColdBoot/WatchdogMay 28 09:34:09 ZJSHX-MS-WLAN-AC51-CD %CC-4-TXAPRESET: Requesting A
4、P 5C-0E-8B-45-4E-9B reset (AP adoption not complete)May 28 09:34:26 ZJSHX-MS-WLAN-AC51-CD %CC-6-APREADOPTREASON: AP 5C-0E-8B-45-4E-9B readoption reason: ColdBoot/Watchdog解决方案:断电重启AP或者远程重启AP使挂起的进程恢复。对于重启无效的AP需要进行软件版本升级解决。案例二:施工工艺引起AP假死故障描述:某AP出现频繁掉线引起假死,查看后发现AP指示灯闪烁为绿色,但过一段时间后出现闪黄灯,反复变动。通过分析发现主要是AP远程
5、供电不稳或者数据传输异常引起。造成这两种情况的主要原因为网线水晶头未按标准进行制作和射频口松动和弯曲。射频口松动和弯曲会造成AP发射和接受的信号不正常,导致数据出现异常。解决方案:加强提高施工质量及施工工艺,规范验收环节验收内容。施工和验收时对网线长度、网线达到的性能、水晶头达到的性能,施工注意事项落实情况都纳入验收环节,施工队伍在施工时也需要按照施工要求进行施工。案例三:交换机端口POE远供不足或者因网线过长导致AP获取的功耗始终在一个临界阀值徘徊故障描述:AP 供电不足致时常重启。交换机端口远供一般为15.4W,AP功耗大于12W,所以当网线过长或POE供电不足时将导致AP获取的功耗始终在
6、一个临界阀值徘徊。解决方案:规范验收环节验收内容,网线过长不应大于70米。对于交换机端口供电不足问题,可以将交换机纳入网管系统,监控端口POE供电异常。1.2 AC频繁重启/宕机问题AC频繁重启/宕机问题分析AC频繁重启/宕机故障将影响用户的无线使用感知,引起AC稳定性差的主要原因如下:(1) AC 内核运行不稳定导致的AC 重启/宕机(2) AC 电源老化问题导致AC 重启/宕机 场景案例分析:案例一:AC 内核运行不稳定导致的AC 重启/宕机故障描述:在某次AC 非正常Down机后查看 AC 重启记录,可以看到 AC 由于 kernel panic (内核出错)原因导致 AC shutdo
7、wn,间隔一段时间 后AC 重新启动。AC flash crash 文件夹生成一个故障的说明文件。如下:Jan 13 11:37:28 2012 startupJan 13 03:37:28 2012 shutdown (ungraceful:kernel panic)同时查看 AC的 crash file :可以看到在 2012 Jan 13 11:37 分 在 AC startup 时候产生了一个 dump 文件,拆开dump 文件,可以看到 在 panic 字段 有一 注释为 Watchdog panic ,为此可以判断 此次AC down 机 为 watchdog 原因导致。解决方案:
8、增加AC的内存,对一些配置参数进行优化,删除多余无用配置和关闭一些未用的功能,减小AC的AP和用户负荷。案例二:AC 电源老化问题导致AC 重启/宕机故障描述:某台AC重启后,找到以下的重启记录提示:Feb 02 10:29:16 2012 startup- - - shutdown (ungraceful:unexpected cold restart)查看AC Log日志,AC在shutdown时无任何信息留下,在重启时间点也无dump 文件产生。由于AC电源出现问题时,AC会瞬间掉电,不会自动记录任何数据,而且接通电源时AC 又会自动启动,所以无任何信息记录。 解决方案:在AC不能进行双
9、电源冗余改造的情况下,可以对有电源故障隐患的AC进行电源更换操作解决。2.N+1冗余优化N+1热备针对的是AC的临时故障所做的一种备份技术,通过备份,来避免长时间的服务中断,保证业务长期,可靠的运行。对于无线网络的关键设备和设施,需要提最高冗余能力。保证在核心设备临时故障发生时,维护人员能够快速恢复正常的网络应用,获得更多的故障处理时间和空间。2.1 主备AC未能进行正常切换问题描述:在主机宕机时,备机未能有效接管主机的业务,造成业务中断时间过长。问题分析:1. 主备AC冗余关系没有建立2. AC间心跳线缆出现问题3. AC间心跳通讯出现异常,链路出现丢包或拥塞延迟4. 设备问题处理步骤:1.
10、查看“show wireless ap”确认冗余是否启用,查看“show redundancy members”,确认主备AC间冗余关系是否建立。如果没有建立,请查找是否是以下原因引起: Redundancy未启用,组员未添加 主备AC之间建立的心跳IP地址是否能够互通 上联端口是否透传心跳vlan 其他配置问题2.查看心跳线缆是否正常,端口是否启用3.查看心跳通讯是否正常,主机ping备机的心跳地址是否有丢包,有时延。4.查看热备配置是否完整5.检查AC版本是否支持切换,主备AC是否版本相同6.检查设备是否出现异常2.2 AP切换异常问题描述: 主备AC切换后,备机未能接管AP或者备机接管了
11、比之前宕机主AC还多的AP(包含其他主机的AP) 。问题分析:1. AP网关侧未进行备机私有地址的relay指向2. 备机的AP 地址池option 选项有误3. 备机路由未指或指向错误4. 备机国家代码(country-code)未设置5. 备机 dhcp服务是否开启6. 其他配置问题处理步骤:1. 查看AP网关侧是否指向了到备机私有地址的relay,并确认relay配置没有问题2. 查看备机的option选项是否为备机私有地址3. 当出现备机接管的AP比之前宕机主AC的还多时,需注意将备机AP地址池中的option选项改为之前主AC的地址和备机的地址共两个4. 确认备机存在指向AP地址段的
12、路由。在备机上ping AP的网关不存在丢包或延时5. 检查备机国家代码(country-code)是否设置成cn6. 确认DHCP服务开启2.3 用户业务切换异常问题描述:AC主备切换后,用户无法正常自动弹出portal页面或者无法认证上网问题分析:1. 确认用户是否可以获取地址2. 备机 WLAN 配置出现问题3. 备机 用户地址池分配出现异常4. 备机 路由指向错误5. 其他问题(如radius问题)处理步骤:1. 确认用户可以获取地址,不然查看用户地址池和DHCP进程是否开启。DHCP进程挂死的,需要进行重置恢复。2. 检查WLAN配置参数是否设置错误,例如query参数是否错误,po
13、rtal重定向地址是否错误等。3. 确认路由指向没有问题,在备机上ping一些公网地址没有丢包,时延。4. 确认radius服务器等没有问题2.4 CPU负荷异常问题描述:热备实施一段时间后,由于关联人数过多造成热备集群内组员AC CPU普遍负荷严重。问题分析:当集群中的某台AC上有大量的关联用户的时候,其它组员AC将同步这些关联终端的信息。因此当这个集群中的每台AC都有大量关联终端的时候,就会造成AC因需同步大量终端信息而高负荷运行,AC的主进程ccsrvr cpu利用率会特别的高。处理步骤:1. 控制集群组内各组员AC的用户数,每台AC的关联人数不应大于1000人,集群组内所有AC的关联人
14、数总和不应大于2500人2. 实施热备主机不应过多,N小于等于33. 叫厂家将AC版本中的用户冗余机制去除2.5 切换时间过长问题描述:当主机宕机时,备机切换过程时间过长,大于1分钟问题分析:1. 心跳链路出现异常,是否出现链路拥塞2. 心跳间隔周期和保持间隔时间设置过长所致3. 备机自动revert恢复时间设置过长所致4. 主备机发现时间设置是否设置,设置是否过长处理步骤:1. 检查心跳链路是否正常,主AC ping 备机是否出现丢包或者延时2. 将主备心跳周期“heart-period”设置为510s, “hold-period”设置为1530s3. 备机启用auto-revert设置,并
15、将auto-revert-period周期设置为最低1分钟4. 将主备机discovery-period间隔周期设置为1530s左右,默认设置为30s3.组网构架优化3.1 单点故障问题问题描述:网络拓扑中,往往存在一些单点故障,无论是设备或者链路单点,一旦出现问题将影响全局造成很大的隐患。案例分析:如上图出现就出现了两种情况的单点故障:S5500的单点设备故障和链路单点。如果将上图拓扑改成以下就会明显改善问题。H3C 5500进行堆叠技术处理,AC的上联链路和S5500的上联链路做链路捆绑技术来解决单点故障隐患。上层设备可利用路由技术实现解决单点问题的隐患。处理步骤:1. 设备堆叠技术解决设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AC优化指导手册 AC 优化 指导 手册
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内