无线WiFi-博达无线产品线故障排查.docx
《无线WiFi-博达无线产品线故障排查.docx》由会员分享,可在线阅读,更多相关《无线WiFi-博达无线产品线故障排查.docx(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.故障处理流程检查AC配置是否 正确这种一般为powerac故障导致,ACWEB启动后会与powerac建立一个IPC连接,这是一个 AC内部的IP连接通信,如果没有建立或者连接不稳就会造成链路中断的现象。rootlocalhost # netstat -anp |grep javatcp00127.0.0.1:8005:*LISTEN15766/javatcp000.0.0.0:80090.0.0.0:*LISTEN15766/javatcp000.0.0.0:900.0.0.0:*LISTEN15766/javatcp00127.0.0.1:33289127.0.0.1:5001 EST
2、ABLISHED 15766/java上述最后一行就是ACWEB与powerac建立的通讯连接,powerac监听的端口是tcp 5001 , 如果没有建立这条连接,或者连接不稳定,就会出现读不到动态信息的现象,并且会提示链路中断。 造成这种现象的原因一般是powerac故障,或者powerac发生了重启但ACWEB没有跟着重启, 可能会造成通讯异常,从而导致此类故障。可用pidof powerac查看进程号,正常情况下可以看 到很多数字(进程号),如果没有则说明powerac异常,需手动重启powerac :rootlocalhost # cd /usr/1ocal/ac/bi nrootl
3、ocalhost # ulimit -c unlimitedrootlocalhost # kill all -9 powerac; nohup ./powerac /dev/null 2&1 & rootlocalhost # pidof powerac7305 7304 7288 7287 7286 7285 7284 7283 7282 7281 7280 7279 7278 7277 7276 7275 7274 7273 7272 7271 7270 7269 7268 7267 7266 7265 7264 7259备注:上述第二行是打开堆栈的动作,这样一旦powerac再次发生故
4、障可能会记录一个core 文件,可以协助分析进程重启的原因,并非必要。3)进行配置操作时提示需要进行网元同步出现这种现象的原因是AC上保存的配置跟AP上实际的配置不一致,原因可能是之前的配置 没能正确下发,这时候最好不要点是进行网元同步,那样会消耗比较长的时间。建议点击【WEB 服务管理-WEB服务全局刷新】进行全局刷新,或者重启下ACWEB ,并注意尽量避免多人同时登 陆WEB进行操作,那样会造成配置数据异常。4)配置时出现不允许配置的问题查看【WEB服务管理-WEB访问控制】是否做了相应的权限配置,如果没有强制要求,这个 地方不建议进行读写权限配置。如果已经进行配置且用户没办法进行操作了,
5、请联系技术支持。查看自己的账号是否具有配置权限。5)其它配置错误23 AC挂死AC挂死指AC设备系统进入一个异常状态,无法正常运行,甚至连报文收发都不正常,而且 不会自动重启,必须人为干预的一个异常状态。目前已知的会导致AC设备挂死的原因有:机框式 X86单板BIOS版本是A1.2 ,如果遇到供电电流抖动,时间超过50ms ,就会进入挂死状态,解决 办法是升级BIOS到A1.3 ,目前新出厂的设备BIOS都会更新到A1.3。主控板的前面板接口图如下所示:COM USB GbE主控板前面板图此外前面板上提供以下LED灯用于指示单板状态:无服务LED (红色)介质LED (琥珀色)用户LED(绿色
6、)热插拔LED (蓝色)重置按钮LEDLED灯的详细定义如下:热插拔LED (蓝色)FRU状态号FRU状态名称灭M0FRU没有安装亮MlFRU没有激活长闪M2FRU需要激活灭M3FRU正在激活灭M4FRU激活短闪M5FRU需要去激活短闪M6FRU正在去激活无服务LED(红色)状态备注闪烁BIOS POST 中FRU状态M4灭BIOS POST 成功FRU状态M4亮关闭os后FRU状态Ml介质LED (琥珀色)状态备注闪烁进入硬盘I/O接口灭硬盘I/O 口空闲用户LED (绿色)状态备注亮默认亮这个LED是为客户程序预留的, 可以通过GPIO控制。正常情况下,无服务LED灯应该是灭的,如果常亮说
7、明系统故障,设备挂死。正常情况下所 有的热插拔指示灯都是灭的,如果有亮蓝色灯说明相应模块没有插好,或供电异常,请重新插拔板 卡和相应的模块,如果仍不正常可尝试用替换法更换槽位和板卡来测试故障点。正常情况下,用户LED灯应该常亮,代表系统正常运行;介质LED灯应该偶尔闪亮,代表硬 盘在进行读写操作;网口指示灯右边一个常亮,代表网口已经连通,左边一个闪亮,代表正在收发 数据;光口指示灯应该闪亮,代表光口连通并有数据收发,如果不亮,可能是光纤插反或光路不通。如果机框周围指示灯有亮蓝色灯,说明机框给板卡的供电异常,尝试更换槽位看能否恢复正常; 如果主控板上有亮任何蓝色灯,说明有模块未插好,重新插拔后重
8、启看能否恢复,不能恢复则替换 相应模块。如果用户LED灯不亮或者无服务LED灯常亮,说明系统运行异常,必须用串口或者外接显示 器、键盘查看启动情况;如果串口无反应,尝试掉电重启AC,查看串口有无打印,如果无则硬件 损坏,必须返厂维修,如果能进入BI,主要是查看能否找到硬盘,可尝试把BIOS恢复缺省配置再 重启试试看OS ,可按DEL键进入BIOS查看外围设备是否都正常,如果找不到硬盘,则说明硬盘 坏或硬盘未插紧,此时硬盘卡的热插拔灯应该亮蓝色,重插硬盘卡即可;如果能找到硬盘,系统应 该能自动从硬盘引导并进入系统,可多等几分钟看能否正常启动,如果不能则说明硬盘数据损坏, 可替换硬盘或者直接返厂。
9、3.用户现场故障处理WLAN网络中通过AC+瘦AP以及交换机、BAS等网元设备的组网,实现了用户无线接入网络以提供方便的网络服务,按照AC/AP对用户业务报文的处理方式,可以将组网分为3类,分别是本地转发,集中转发二层转出和集中转发三层转出,如下图所示:用户业务流左边是本地转发方式组网,本地转发的特点是业务流不经过AC ,由AP添加业务VLAN ,交 换机二层透传直至BAS,目前大部分WLAN网络采用这种方式组网。本地转发组网下AC不用处 理用户业务报文,只需对AP进行管理,用户报文由AP添加业务VLAN并转发,透过二层网络直 至BAS ,由BAS来给用户下发地址、提供认证功能和上网通道。中间
10、一种是集中二层转出的组网方式,业务流要经过AC,不过AC并不做处理,而是直接二 层转出,还是由BAS来给用户下发地址、提供认证功能和上网通道。集中转发的特点是业务流要 经过AC,对AC吞吐量的要求比较高;在AC-AP之间,用户的业务报文是经过CAPWAP隧道封 装的,与管理报文共享传输通道,因此下行链路无需配置业务VLAN ;报文抵达AC后,剥除隧道 并添加业务VLAN后二层转发到BAS ,因此业务VLAN只需配置到L2-WAN 即可。右边是集中三层转出的组网示意图,这种组网方式是由AC给用户分配地址并提供认证功能, AC作为用户业务网关,可以实现对用户业务的三层转发,支持NAT和路由,可以理
11、解成AC融合 了 BAS的功能,同时也需要对AP进行管理。下行链路与集中二层转出一样,也是通过隧道接收用 户报文,无需配置业务VLAN ;内部需配置用户网关地址、DHCP服务以及认证等功能,业务VLAN 终结在AC上;上行接口是L3-WAN 口 ,需配置公网IP、网关以及互联VLAN,保证AC可以正 常访问公网。用户面上网可以分为两个阶段,首先是用户无线关联AP,建立二层通路,这个过程相当于有 线网络中的插上网线的过程,由于无线网络的便捷性、安全性的要求,加上无线介质本身的不可靠 性,无线的关联过程并不像有线简单的插上网一样简单;第二阶段是用户业务报文由AP-AC进 行转发并处理的过程,本地转
12、发组网用户业务是由AP-交换机-传输链路-BAS来完成转发;集中二 层转发则是由AP-AC-BAS来完成业务转发和处理,其中AP-AC间经历了传输链路;集中三层转 发则是由AP-AC完成业务转发和处理,AC是业务控制点。因此故障可分为无线和组网两部分来排查。3.1 无线问题问题分析注意区分用户无法关联和无法获取地址的区别,无法关联就像是网口没插一样,网络连接图标 是未连接状态,是一个红叉的图标,表示链路未连通;而关联获取不到ip地址会显示网络受限, 是一个三角形加感叹号图标,表示当前网卡网络层不通。有些情况下无需获取ip地址只要关联上即可比如用户采用PPPoE拨号上网比如用户进行802.1X认
13、证的过程中但是若需要进行Portal 认证前则一定要先获取IP地址,用户完成802.1X认证后开始访问网络之前也是必须获取IP地址。故障排查1)用户无法关联到AP用户关联到AP的过程比较简单,首先终端发起关联请求,AP收到关联请求后回以关联响应, 响应报文中包含鉴权方式;根据鉴权方式的不同,终端发起鉴权请求,OPEN方式AP侧无需进行 鉴权直接回应鉴权响应用户成功关联到AP如果AP设置了安全访问限制比如采用WPA/WPA2 加密,则需进行进一步的鉴权交互,鉴权完成后,终端才能关联到APO如果用户无法关联,先检查AP上SSID是否是Open方式鉴权,一般情况下,业务SSID都 是Open方式鉴权
14、;如果是而用户却关联不上,则检查AP上是否设置了关联数用户限制,以及是 否已经达到限制的用户数;注意有两个用户数限制可配,分别是AP级用户数限制和VAP级用户数 限制,任何一个达到临界值用户都无法关联成功。如果SSID配置了安全策略,请先确保客户端设 备支持所选择的鉴权、认证方式,(比如Android手机目前就不支持SIM认证,I0S6存在SIM认证 缺陷)且需对客户端进行相应的配置,具体请参考附件中WPA接入说明,并需提供正确的凭据以供 验证。用命令检查AP上关联统计,分析关联失败原因:# ieee80211cfg apO_l getstat assoc ssid: CMCCulStaAss
15、oc:2ulAllStaTime:40731ulAssocTimes:911ulAssocFaiiTimes:848ulReassocTimes:8ulDi sassocBySta:31ulAssocFai1 Resource:0ulAssocFai1 BaseRate:0的总次数ulAssocFai1NotStd:0ulAssocFailOther:848当前关联的终端数关联次数由于接入点资源有限而被拒绝关联的总次数因终端不支持基本速率集要求的所有速率而关联失败由不在802.11标准制定范围内的原因而关联失败的总未知原因而导致关联失败的总次数由于之前的关联无法识别与转移而导致重新关联失败重关
16、联失败次数ulAssocFai1NotShi ft:0的总次数ulReassocFai1Times:0ulReassocFai1Resource:0ulReassocFai1 BaseRate:0ulReassocFai1NotStd:0ulReassocFai1 Other:0ulReassocFai1NotShift:0对于由于接入点资源有限而被拒绝关联的总次数 一般是由于AP上用户数已经达到配置的最大接入用户 数导致的关联失败;其它原因则需进一步查看统计,并把统计反馈给研发处理。 # iwpriv apO_l iv_stats;dmesg省略mgmt frame stats火*女*火*i
17、 s rx mgtdi scard= 510537i s rx bad auth= 0i s rx auth spoof= 0i s rx acl= 0i s rx auth countermeasures= 0i s_rx_auth_unsupported= 0i s rx auth fail= 0i s rx assoc notrun= 0i s rx reassoc notrun= 0i s rx assoc bss= 0i s rx reassoc bss= 0i s rx assoc badrequest= 0i s rx reassoc badrequest= 0i s rx as
18、soc notauth= 397i s rx reassoc-notauth= 0i s rx assoc capmi smatch= 0i s rx reassoc capmi smatch= 0i s rx assoc norate= 0i s rx reassoc norate= 0i s rx assoc badwpai e= 475/wpa 关联失败i s rx reassoc badwpai e= 0省略确认用户无线网卡支持相应的频段和模式:比如大部分终端网卡不支持5.8G频段,因此无法关联至 5.8G的AP信号;如果终端被强制成5.8G模式,就会无法关联到2.4G信号;如果终端只
19、 能支持11b模式,或者被强制配置成11b模式,而AP被配置成g/n模式,不兼容b模式,就会 出现关联失败;如果终端或者AP的国家码不正确,由于不同国家的ISM频段也不尽相同,因此也 可能造成无法关联甚至搜索不到信号的问题,请将终端国家码设置成中国。2)确认无线信号是否正常使用WirelessMon等无线扫描软件可以扫描到AP发出的信号情况,看AP信号的强度是否 足够,以及是否稳定;一般信号强度在-30-60dBm连接效果比较好,低于-75dBm则信号偏弱, 信号覆盖不足,高于-20dBm则信号过强;如果信号强度波动很大,经常时有时无,则终端关联也 会不稳定。常用信号扫描软件用法参见附录。查看
20、信道干扰情况,对于2.4G无线网络有3个独立信道,常用的是1、6、11三个信道,尽 量让AP均匀分布在这三个独立信道,尤其相邻区域AP信道应当尽量避开,以避免互相干扰;如 果信号很好,但同信道相同SSID的AP个数超过3个,且最强信号强度与次强信号强度差不足 10dB ,则属于过覆盖,应该适当降低AP的发射功率,如果调整功率仍无法满足,应当减少AP布 放。如果最强信号强度不足-65dBm ,则属于覆盖不足,应当适当增加AP发射功率,或适当调整 天线位置和角度,以满足信号覆盖强度要求,如果不足则增加AP覆盖。AP上查看终端上行信号强度是否满足要求: # wlanconfig apO_l list
21、 staAID CHAN TXRATE RxRATE RSSI IDLE TXSEQ RXSEQ CAPSACAPS ERPSTATE5010 15604 48512 ESs5010 15604 48512 ESs00:la:7f:0a:4f:04 1154M11M23 Q WMEbc:cf:cc:df:a4:4f 211M11M1504262096 ESs33 Q WME00:e4:4c:30:a5:21300:e4:4c:30:a5:21354M54M45064348023 Q WMERSSI列表示AP接收到终端信号的信噪比,一般20以上说明信号比较好,28-60之间最佳,低于20说明信号
22、偏弱;TxRATE表示AP给终端发包的速率,RxRATE为AP接收终端上行报文的 速率,如果信号弱则收发报文速率会比较慢。3.2 本地组网转发问题分析本地转发情况下,用户业务由AP打上业务VLAN并转发,如果出现用户业务故障,一般跟AC无关,比较常见的原因是业务VLAN不正确或者AP本身故障。本地转发组网要求传输网络同 时配置管理VLAN和业务VLAN ,其中管理VLAN终结至! AC或三层交换机(有些是BAS),业务 VLAN终结到业务BASO本地转发业务和管理通道分离,AC-AP间管理隧道只传送管理报文,不 传送业务报文,用户业务报文由AP本地转发,不封装隧道,直接添加VLAN后经由业务V
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 无线 WiFi 博达 产品线 故障 排查
限制150内