TD-LTEeNodeB故障排查指导手册6160.pdf
《TD-LTEeNodeB故障排查指导手册6160.pdf》由会员分享,可在线阅读,更多相关《TD-LTEeNodeB故障排查指导手册6160.pdf(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、修正版 TD-LTE eNodeB 故障排查指导手册 修正版 目录 1 产品概述.1 1.1 BBU 基本功能和指标.1 1.2 BBU 系统架构介绍.2 2 故障告警概述.3 2.1 BBU 故障分类.3 2.2 BBU 告警表.4 3 故障分析定位与处理.4 3.1 传输承载子系统类故障.4 3.1.1 偶联建立失败.4 3.1.2 IP 地址冲突故障.5 3.1.3 传输接口的状态查看.5 3.1.4 前后台不能建链.7 3.1.5 获取不到用户面下一跳 MAC 地址.8 3.2 操作维护子系统类故障.9 3.2.1 LMT 无法登录.9 3.2.2 基站可以 PING 通,但 LMT
2、无法登录成功.9 3.2.3 远程 LMT 登录出现 FTP 上传失败.10 3.2.4 信令跟踪无法使用.10 3.2.5 EMS 的客户端拉远模块无法使用.11 3.2.6 ORACLE 数据库与网管软件无法连接.11 3.3 基带和 CMAC 故障.11 3.3.1 UE 初始接入失败.11 3.3.2 UE 配置 CQI/PMI/RI,但是 UE 并不上报 CQI/PMI/RI.12 3.3.3 UE 侧检测到业务的 DCI 包数与调度不一致.12 3.3.4 UE 侧检测到业务的 CRC 全错.13 3.3.5 UE 侧检测到业务的 CRC 出现部分错误(BF 环境).13 3.3.
3、6 高通终端(AL680S)因安全模式打开无法接入处理.13 3.3.7 UE 的 RI 打桩设置为 2,信道质量很好,但是基站没有调双流.14 3.4 业务及流程故障.14 修正版 3.4.1 SCTP 偶联断开.14 3.4.2 S1 建立失败.15 3.4.3 X2 建立失败故障.16 3.4.4 PING 包不通故障.16 3.4.5 小区建立故障.17 3.4.6 自研 UELMT 无 RSRP 显示.18 3.4.7 UE 无法下行同步或无法选到合适小区.19 3.4.8 UE 已接入至目标侧后,X2 口切换依然失败.19 3.4.9 X2 口切换触发失败.20 3.4.10 测量
4、报告触发失败.21 3.5 RRU 类故障.21 3.5.1 通过 BBU 无法远程登陆到 RRU.21 3.5.2 天线口没有功率输出.22 修正版 1 产品概述 1.1 BBU 基本功能和指标 TD-LTE BBU 产品 ZXSDR B8200B8300 是一款基于中兴 SDR 统一平台的 BBU,采用基带射频分离的架构,以适应运营商长期演进的低成本策略。ZXSDR B8200B8300 作为多模紧凑型 BBU,主要提供 S1,X2 接口、时钟同步、与RRU的基带射频接口等功能,实现内部业务及通讯数据的交换;BBU与RRU之间采用数字基带信号光纤拉远。ZXSDR B8200B8300 产品
5、的主要功能包括:BBU 与 RRU 之间通过 OBRI/CPRI 接口连接,完成对 RRU 控制和数据的处理功能。数据流的 IP 头压缩和加密 无线资源管理:无线承载控制、无线接入控制、移动性管理、动态资源管理 UE 附着时的 MME 选择 路由用户面数据到 S-GW 寻呼消息调度与传输 移动性及调度过程中的测量与测量报告 PDCPRLCMACULPHYDLPHY 数据处理 通过后台网管(OMC/LMT)提供操作维护功能:配置管理、告警管理、性能管理、版本管理、前后台通讯管理、诊断管理。提供集中、统一的环境监控,支持透明通道传输;支持所有单板、模块带电插拔;支持远程维护、检测、故障恢复,远程软
6、件下载;设计充分考虑了系统兼容性和扩展性,可通过更换基带单板、更换射频单元或软件更新方式支持 GSM、TD-SCDMA。ZXSDR B8200B8300 关键技术指标如下表:关键技术指标 BBU B8200B8300 尺寸(mm)88.4mmx482.6mmx197mm(高 x 宽 x 深)2U19 133.3mmx482.6mmx197mm(高 x 宽 x 深)3U19 满配重量 PrintfArp ARPinformation-net_If:1Vlan-id=0(Statue:UP)IP:0 x8C010283Haddr:00-00-00-00-00-00ARPF_WAITING62062
7、0 packetaddr:0 x0861cf48,datalength:76.IP:0 x9F010283Haddr:00-17-31-88-88-AFARPF_ALWAYS_USE4040-TotalItems:2(AddedStatic:0TotalStatic:1)arpCachePkts:1arptime:60000 查看 IP 对应的 MAC 地址是否已经获取到,是否正确。4 其他说明 修正版 无。3.1.2 IP 地址冲突故障 1 故障现象 后台网管上报“IP 地址冲突”告警。2 故障分析与定位 出现此问题的可能原因:在核心网上连接多个 eNB 时,如果配置的 IP 地址没有按照规
8、划好的 IP 地址进行配置,就可能出现配置的两个 eNB 的 IP 地址相同。eNB 在启动后,发送免费 ARP 请求,检查是否有和自己相同的 IP 地址,如果有就打印这时就会出现 IP 冲突的现象。3 故障处理方法 修改基站的 IP 地址,保证不重复。4 其他说明 无。3.1.3 传输接口的状态查看 1.故障现象 传输物理接口-传输介质可以是光和电。由于目前在后台无法查看当前使用的光口/电口是否正常。如果使用电口,需要注意协商成功的是哪种工作模式(10Mbps 半双工、100Mbps 全双工、自适应、10Mbps 全双工、100Mbps 半双工、1000Mbps)。2 故障分析与定位 在 C
9、C 中输入命令查看当前网口的工作模式。如下图所示,abis 口异常、debug 口正常。修正版 3 故障处理方法 需要察看 abis 口的物理连接是否正常;需要查看 abis 口协商后的工作模式是否正确;当传输接口为电口时:下图显示的电口工作正常且工作模式为 100Mbps 全双工。修正版 当传输接口为光口时:下图显示光口正常且工作模式为 1000Mbps 全双工。4 其他说明 无。3.1.4 前后台不能建链 1.故障现象 OMC 与基站界面显示断链。2 故障分析与定位 检查配置:OMC 接入的 IP 是否与基站的 IP 一致;基站是否配置 OMC-B 参数;检查物理链接;三次握手检查。3 故
10、障处理方法 使用抓包工具查看,后台网管是否发送主动断链请求包(Syn 包:0 x02);基站是否回复(Syn-Ack:0 x0a);后台是否回复(Ack 包:0 x08);情况一:如果网管一直发送了 Syn 包(0 x02)后,基站侧未回应。则需要基站侧人员具体定位。情况二:修正版 如果后台发送 Syn 包(0 x02)请求,基站侧回应 Syn-Ack(0 x0a),后台并没有发送Ack(0 x08)包进行响应,而是重传了 Syn(0 x02)包。前后台始终三次握手不成功。则需要查看基站侧 Syn-Ack 包是否要求重传,如果是,找基站侧人员定位。如果否,则需要找后台人员定位。4 其他说明 无
11、。3.1.5 获取不到用户面下一跳 MAC 地址 1 故障现象 eNB 启动后偶尔出现用户面通道不通的情况,用户面上行数据,在 QE 上不能进行转发。查看 QE 的上行的用户链接表,发现对应 mac 地址为 0。CC-Print_Rwd_Connect_Info()RwdconnectDataStructAddressis0 xf340f8 array0DestIPis0 x0 array0UseTimesis0 x0 array0NextHopMacis0 x000 x000 x000 x000 x000 x00 array1DestIPis0 x0 array1UseTimesis0 x0
12、 array1NextHopMacis0 x000 x000 x000 x000 x000 x00 array2DestIPis0 x0 array2UseTimesis0 x0 array2NextHopMacis0 x000 x000 x000 x000 x000 x00 array30DestIPis0 x0 array30UseTimesis0 x0 array30NextHopMacis0 x000 x000 x000 x000 x000 x00 array31DestIPis0 x0 array31UseTimesis0 x0 array31NextHopMacis0 x000 x
13、000 x000 x000 x000 x00 查看 BRS 的 ARP 表,-PrintfArp ARPinformation-net_If:1Vlan-id=0(Statue:UP)IP:0 x9F010283Haddr:00-17-31-88-88-AFARPF_ALWAYS_USE4040-TotalItems:2(AddedStatic:0TotalStatic:1)arpCachePkts:1arptime:60000 发现没有对应用户面核心网接口板的 arp 表项,2 故障分析与定位 由以上现象可以断定 BRS 获取接口板 mac 地址失败。BRS 对 ARP 表维护的流程如下:修
14、正版 当配置静态路由或 IP 端口的网关时,会新增静态路由下一跳或者网关地址的 arp 表项发起 arp 请求,arp 表项为 ARPF_WAITING;超时触发重复发起 ARP_MAXRETRY 次 arp 请求,超过 ARP_MAXRETRY 次,会将 arp 表项删除,分析可见是相应的配置过后,BRS发起ARP_MAXRETRY次对端没有响应,导致arp表项已被删除。3 故障处理方法 可以采用从核心网侧用户面网元 ping 一下 CC 的 IP 地址,这时,ARP 表中就会有用户面下一跳的 MAC 地址,然后再建业务,QE 就可以进行转发了。4 其它说明 无。3.2 操作维护子系统类故障
15、 3.2.1 LMT 无法登录 1 故障现象 LMT 无法登陆成功,使用网管虽可建链但基本功能均不可用,如做查询或配置操作时返回值均为:9,也就是未知错误。2 故障分析与定位 出现这种故障可能原因:前台 OAM 的 trapport 操作失败,致使与后台连接出现异常。3 故障处理方法 本故障出现概率很小,至目前未解决需要重启基站规避。4 其他说明 无。3.2.2 基站可以 ping 通,但 LMT 无法登录成功 1 故障现象 在PC机网络适配器速度为自动感应条件下,可以ping通基站但LMT无法登陆成功。2 故障分析与定位 出现这种故障可能原因:防火墙导致;FPGA 未加载导致 Debug 口
16、与 PC 间速度协商失败,一般出现在删除过电子盘上的文件之后。3 故障处理方法 可以关闭防火墙试解决,在运行中输入:smc-stop(公司的)或netstopsharedaccess(WinXP 自带的)并回车,这两种防火墙都出现过修正版 使 LMT 登录失败;将连接基站 Debug 口的 PC 的网络适配器的速率设置为 100M 全双工。4 其他说明 无。3.2.3 远程 LMT 登录出现 FTP 上传失败 1 故障现象 远程 LMT 登录基站,出现 FTP 上传失败故障。2 故障分析与定位 出现这种故障可能原因:远程 PC 的 21 号端口被占用;BBU 出现故障。3 故障处理方法 远程
17、PC 的 21 号端口被占用,LMT 登录过程中,BBU 需要使用 LMT 附带的 ftp 服务器上数据库文件。对这种情况下,规避方式如下:打开 PC的任务管理器查看是否已经启动过别 ftp 服务器进程,类似“ftpserver”名称,如果有的话,关闭这个进程,然后重新打开 EOMS 即可。如果任务管理器中没有找到别的 ftp 服务器进程,也可以重启 PC;BBU 出现故障,可以使用 cmd 的 ftp 命令尝试登录 BBU,如果登录不上,先尝试用 telnet 登录,使用 OSS_DbgGetAllUsePCBInfo 命令将查看到的所有进程进行信息截图发给产品第一响应组。然后尝试复位基站。
18、4 其他说明 无。3.2.4 信令跟踪无法使用 1 故障现象 在单独安装的客户端,客户端可以登录服务端,但是无法启动信令跟踪,在点击登录后,显示无法登录。2 故障分析与定位 出现这种故障可能原因:目前的信令跟踪,是一个比较独立的软件,需要直接和前台通讯。不像其他系统工具是通过网管的服务端转发的。所以一旦单独的客户端找不到通往前台的路由,信令跟踪就无法使用。3 故障处理方法 在地面资源管理的传输配置中,右键添加 OMC-B 链接,在弹出的界面中,填写 OMC的 IP 地址为客户端所在机器的 IP 地址。4 其他说明 无。修正版 3.2.5 EMS 的客户端拉远模块无法使用 1 故障现象 EMS
19、上的客户端拉远模块无法使用,所有拉远的功能无法使用。2 故障分析与定位 出现这种故障可能原因:OMM 和 EMS 的网络连接出现异常;OMM 和 EMS 的版本不匹配。3 故障处理方法 如果 OMM 和 EMS 的网络连接出现异常,首先检察物理连线是否正常,然后检察 EMS 和 OMM 之间的路由是否正常,如果有防火墙,需要关闭防火墙在链接;如果 OMM 和 EMS 的版本不匹配,可以在网元管理中,在 OMC 节点右键选择强制上载,EMS回从OMM通过 FTP 上载 ERT 拉远客户端到EMS的服务端。3.2.6 Oracle 数据库与网管软件无法连接 1 故障现象 网管程序与数据库无法正常连
20、接。2 故障分析与定位 出现问题的可能原因是:数据库相关服务没有正常启动和数据的监听程序配置错误。3 故障处理方法 查看任务管理器中 oracle.exe 进程是否启动(Windowsxp 系统);查 看 系 统 服 务 中,是 否 已 经 启 动oracle相 关 服 务(OracleDBConsole*,OracleOraDb10g_home1TNSlistener,oracleService*等(*为数据库实例名),确保相关服务改为自动启动;利用 Sqlplus 命令连接数据库查看,命令格式如下:sqlplus 用户名/密码数据库实例名”如能够进入数据库中表明连接正常。如果不能进入需要查
21、看监听程序以及服务程序配置是否成功。4 其他说明 无。3.3 基带和 CMAC 故障 3.3.1 UE 初始接入失败 1 故障现象 从 UE 侧 LMT 看到 Msg1,Msg2,Msg3 不停反复,接入不进去,或者到 Msg4 之后的某一步例如能力信息上不去导致接入不成功。2 故障分析与定位 这种现象可能有如下的原因:修正版 1 UE没有同步到直连的小区,而是同步到干扰的小区 2 信道质量不好,衰落很大 3 UE侧发送功率太小,导致基站CRC检验错误 3.故障处理方法 1.首先查看UE同步到的小区是否和基站小区ID是否一致,如果不一致,重新ResetUE,同步到直连基站。2.如果经1步检查,
22、UE同步到的小区是直连小区,那么查看基站侧Msg3的CRC或PUSCHCRC是否OK,如果Error的很多,检查链路衰减是否正常,如果衰减很大,将衰减减小,再重新尝试接入。3.如果2步的方法仍然接入不了,Msg3CRC或PUSCHCRC仍然有错,那么将基站侧路损补偿因子改成1.0,重新尝试接入。4.如果3步的方法仍然接入不了,怀疑UERF子卡发射功率太小,重启UERF子卡后再尝试接入。4 其他说明 如果故障处理方法中 2 步,Msg3CRC 或 PUSCHCRC 均未错误,排除 phy 链路问题,查看高层信令进一步排查故障。如果在故障处理方法 4 步后仍然接入不了,Msg3 或 PUSCHCR
23、C 仍有错误,从基站 phy 侧抓数交给开发人员进一步分析原因。3.3.2 UE 配置 CQI/PMI/RI,但是 UE 并不上报 CQI/PMI/RI 1 故障现象 UE配置周期CQI/PMI/RI上报,但是从基站侧看到UE并没有发送CQI/PMI/RI,导致传输模式TM3时,因为UE没有上报RI,基站不调双流。2 故障分析与定位 这种现象可能的原因是下行有业务,ACK/NACK和CQI/PMI/RI在同一个子帧传输。LMT中PUCH参数-同一子帧同时发送ACK/NACK和CQI的支持指示默认为false导致。3 故障处理方法 将LMT中PUCH参数-同一子帧同时发送ACK/NACK和CQI
24、的支持指示改为true,待小区建立成功,问题解决。4 其他说明 无 3.3.3 UE 侧检测到业务的 DCI 包数与调度不一致 1 故障现象 UEattach成功后,做上下行业务,UE检测到的DCI包数与eNB侧调度的包数不一致。2 故障分析与定位 这种现象可能有如下的原因:1 链路质量较差,导致PDCCH无法正确解调;2 若自研UE不支持盲检测,则UE和eNB侧的DCIformat(既CCE聚合度)配置的不一致;修正版 3 若自研UE支持盲检测,则有可能是DCI格式的CCE分配失败;3 故障处理方法 首先UE测量的CINR和RSRP,如果CINR在20-30db左右,RSRP在-60-110
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TD LTEeNodeB 故障 排查 指导 手册 6160
限制150内