《显卡检修基本方法及流程ppt课件.pptx》由会员分享,可在线阅读,更多相关《显卡检修基本方法及流程ppt课件.pptx(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、显卡检修基本方法及流程-工程部目的: 作为新进人员教育训练及维修参考之用,使之能够灵活运用各种维修方法和方式,已达到事半功倍的效果。维修方式及方法:1.目测法:检查是否有空焊、短路或脏污等现象。2.比较法:当不确定该信号是否正确时可用良品与不良品做比较。3.指压法:可判断BGA CHIP是否空焊。4.触摸法:触摸零件是否异常发烫。5.电压法:测量各个部分的供电电压是否正常。6.电阻法:a.用万用表电阻档可测量排阻之阻值,若阻值偏小则有可能线路或零件短路;若阻值偏大则有可能线路开路或零件损坏。b.用万用表二极管档可用于判定BGA或IC是否不良(表笔的+极接地,-极接欲测量的点)。实例:1.不开机
2、检修: (1). Flash fail 找不到显卡: a.用目测法检查金手指耦合电容有无虚焊、少件等;金手指是否干净。 b.用电阻法检测各组供电是否有短路,如正常,上电检测各组电压是否正常。 c.用示波器检测Y1两端的27MHZ正弦波信号.如果没有正弦波信号,用万用表测量Y1第1脚是否有1.6V电压,如电压不正常,测量Q2第3脚2.5V是否正常,如果2.5V正常,测量U7复位电阻R840、电阻R829的阻值是否为10K,如电压正常而无波形,测量Y1第1、第3脚是否阻值,如果阻值异常,则可能是U7故障引起;如果阻值和电压正常而无波形,可能是Y1功能坏或C41、C42引起故障,可用代换法排除。 d
3、.如以上三项均无异常,用万用表测量金手指到GPU之间数据线阻值。其主要包括:金手指到GPU的PEX_REFCLK、 PEX_TX(0-15)、PEX_ REFCLK、PEX_TX(0- 15)*、PEX_RX(0-15)、 PEX_RX(0-15)*;金手指A11脚的PEX_RST*信号线; A1与B81脚的PEX_PRSNT*是否相通等。 e.用万用表的电容档测量金手指上电容值是否正常(NV的显卡除目前的GK系列GPU金手指电容为0.22uF外,之前的都为:0.1uF电容)。 f.检测GPU供电线路和复位电阻,必要时可断开L503、L504,分别测量其两个焊点对地阻值,检测是否有供电线路开路
4、或阻值变大。 g.检测U7供电线路和复位电阻,必要时可断开L518、L507、L508、L509,分别测量其两个焊点对地阻值,检测是否有供电线路开路或阻值变大。 h.每一种显卡写Flash都要用相应版本的写入程序,即NVFlash.exe,P2002用V5.118版或以上版本,如用错写入程序,也找不到显卡。(2) Flash fail 能按Y写不进: a.目检 EPROM IC 有无虚焊、少件、错件、反向。 b.如果写入了错误的BOIS也会造成此故障,我们可用“Nvflash -9”或“Nvflash -eraseeeprom命令清空BIOS,再重写。 c.如果还不能清除BIOS,用万用表测量
5、 EPROM IC(U11)3V3电源供电线路是否正常。U11的3、7、8脚均为供电引脚。 d.用万用表测量 EPROM IC 第2、5、6脚阻值是否正常。 e.如以上三项检测没有异常,要拆掉U11,测量其1、2、5、6脚的对地阻值,此时测量的U7相应信号脚的对地阻值(所有数据线对地阻值十分接近),有异常则为U7端有问题,需要加热或更换U7。 f.所有引脚对地阻值正常,可装一个新的EPROM IC上去,故障排除则为原IC坏;如故障不变则可能是U7功能坏,需要对换U7确认。(3) Flash 刷新正常不显示: a.目检金手指耦合电容有无虚焊,少件等;金手指是否干净. b.检测GPU和NVIO复位
6、电阻和供电电路,对于供电电路(GPU周围一些小电感),我们可以用万用表测测电感的电压是否正常;如果电压正常可测量电感阻抗,还可用断开的方法,检测是否有GPU和NVIO供电脚至电感之间线路开路. c.还一些卡因为花屏而导致不显示,可通过更新相应的debug BIOS后进行维修.特别注意:维修OK后必须还原为原卡BIOS!2.一个接口不显示(模拟信号): A.DVI-I转VGA不显:测量J4第8脚阻值a.首先检查场同步信号(垂直同步或VSYNC)是否正常:偏小偏大测量U3第11脚阻值断开L2测量是哪端对地短路0 ohm偏大正常U3坏测量U3第11脚阻值测量J4第8脚是否和其它脚短路L2、R911开
7、路或阻值变大比J4第8脚还小比J4第8脚稍大U3坏更换D5、C4如是J4一端短路先断开C4,不行再折掉J4待查如果是D5一端更换D5b.同样的方法检测J4第C4脚阻值。c.如果测量J4第8、C4脚没有问题,测量LB512是否开路,R848阻值是否正常,如果C1100有故障我们是不易测量出来,可用代换法。d.测量U3第1、2脚到U7.AE9脚和U3第12、13脚到U7.AD9脚是否开路,我们可以折下U3测量。B.VGA不显:个信号脚定义如下图所示,检修方法同上。3.DVI-D不显: a.测量J4相关引脚的阻值,用二极管档测量,阻值一般都是一样的,如果某一引脚阻值偏大或为无穷大,则可能是该脚U7相
8、关点虚焊;如果某一引脚阻值偏小,则有可能是该脚到U7数据线和其它数据线或对地短路。 b.测量U7供电电感LB511、LB517是否开路。 c.测量J4第6、7脚(I2C)阻值是否正常,如果其阻值异常,检测该线路的相关零件。 d.测量J4第16脚(GPIO信号)阻值:偏大测量LB525正常,测量R8阻值;偏大,更换C9、Q541测量Q541第1脚测量D515第3脚偏大,更换D515,不行可能是U7.AF17脚阻值变大或虚焊。正常,测量R938、R942 f. 如果测得J4第6、7脚阻值有问题,先测量LB1、LB2是否开路,U2第10、13脚是否虚焊,R12、R11阻值是否异常;对于C2、C3、D
9、4、D3、U2、Q546等无件,我们可用代换法检测其是否有功能坏故障。 g.测量R23、R14阻值和它们的对地阻值。 h.测量LB512是否开路,R848阻值是否正常,C1100可用代换法排除。i.以上检测均无异常,有可能是U7本身功能坏引起的IDT等不显示帮障,可以代换U7。4.接口颜色异常(模拟信号): A.DVI-I转VGA颜色异常:a.首先检查三基色是否正常:更换C1161断开测量R872、R915阻值是否正常测量J4第C1脚阻值测量J4第C1脚是否和其它脚短路测量R929、L503是否开路;R872、R915是否虚焊、错料断开L503偏大正常偏小或0 ohmJ4端阻值小U7端阻值小更
10、换C1154、D506断开测量R872、R915阻值是否正常偏大或时,检查U7是否空焊或不良故障不变可能是U7问题断开L503 b.同样的方法检测J4第C2、C3脚阻值。 c.如果前两步检测无异常,可用代换法排除C1153、C1154、C1155、C1160、C1161、C1162容值不对的。B.VGA接口颜色异常:检修方法同上。5.花屏: a.用“mats”命令测出不良点,mats可以直接运行,也可以加上 -e 1和 -c 1 等参数。 b.用“edit report.txt”命令查看不良点,主要有以下几种故障现象:所有显存点,一组显存,一个显存,一个显存的4分之1单元,一个显存的单个或几个
11、不规则点。 c.所有显存点不良的板,一般有3种原因造成:FBVDD电压不正常,写错BIOS和GPU基准电压偏置电阻不正常等。 d.一个显存,以M8为例(A00-A31),首先测量数据线FBA_CMD - FBA_CMD的对地阻值,这六条数据线分别通过一个121 ohm的匹配电阻接FBVDDQ,所以每条数据线对地阻值为121 ohm电阻与FBVDDQ串联后,再与GPU和M8内阻并联的阻值。一般约为140 ohm,且所有数据线阻值十分接近。我们一般测量靠显存的一端,如果某条数据线阻值比正常值大2 ohm或以上,则为该数据线GPU端虚焊或其M8至GPU之间线路阻值过大;我们可以先加热GPU,不行再拆
12、掉GPU查这条数据线的焊盘。 e. 如果某条数据线阻值比正常值小2 ohm,则为该数据线与另外一条数据线短路;如果其值为0 ohm,则为该数据线对地短路;其值小于正常值很多,但不为0 ohm,为显存或GPU该点内阻小,功能坏。对于这三种的情况,我们可以分别测量该数据线于GPU和M8端测试点阻值,对比两个阻值,哪端较小即为该元件端短路或元件坏。 f.如果第4、5步骤检测没有异常,我们再测量FBA0_CLK0和FBA0_CLK0*两条时钟数据线的对地阻值,其分析方法和第4、5步的数据线基本相同。 g.如果第6步检测也正常,我们再测量FBA_VREF1、FBA_VREF2两条数据线阻值,这两条数据线
13、分别通过阻值为510 ohm和1.3 K的电阻将FBVDDQ分压后,为显存提供两个基准电压。如果其值偏大,有可能是显存虚焊。 h.造成M8(A00-A30)花屏的还有FBA_VREF1与FBA_ZQ1这两条数据线,它们只连接显存、并且分别通过一个1K和240 ohm电阻接地。 i.对于上面几种数据线,除了数据线、GPU和M8本身问题外,很有可能是所连接的电阻阻值不正确,我们在分析时,要先排除电阻问题,再分析线路。 j.一组显存,以M8、M503为例(A00-A63),我们主要测量 FBA_CMD - FBA_CMD共16条数据线对地阻值,这16条数据线阻值十分接近,约为300 ohm左右(用万
14、用表的二极管档测量),如果某条数据线阻值大于正常值,则可能是该数据线GPU端虚焊或数据线本身阻值过大,我们可加热GPU,不行再拆掉GPU查焊盘;如果某条数据线阻值低于正常值或者接为0 ohm,则为该数据线与其它数据线或对地短路,我们可以分别测量该数据线于GPU和M8、M503端测试点阻值,对比两个阻值,哪端较小即为该元件端短路。 k. 一个显存的4分之1单元,以M8为例(A00-A07),我们主要测量FBA_DQM0、FBA_DQS_RN0和FBA_DQS_WP0这三条数据线,分析方法和第10步基本相同。 l.对于一个显存的一个或多个不规则点,以M8为例(A00),我们只要去测量连接该点的数据
15、线就可以了,A00为FBA_D,分析方法同第10步一样。 m.因为显存的内阻比较大,当显存端有虚焊的故障时,我们通过查数据线是找不异常的,所以不管是什么样的坏点现像,如果我们查不到有异常情况,可以先假设为显存端有问题,我们可以先加热,不行再拆掉显存查焊盘及线路。6.数字代码: 常见的特殊故障代码有:17665、31139、30143、50578、50579、19、27或92等。a. 17665一般是金手指到GPU数据线通信不良引起的,我们一般可以先目检一下金手指是否干净,金手指电容有无虚焊、少料等;写错BIOS或测错程序,可重写BIOS再测一次;用万用表检测金手指数据线阻值和金手指电容;如无异
16、常则可能是GPU功能坏。b. 31139为温度检测出错,首先目检散热器是否正常,再测量THERM_DP和THERM_DP这两条数据线的对地阻值,其他零件无异常则可能是GPU端有不良,可折掉GPU测量焊盘。c. 30143是由于GPU与主板PCIE插槽通信不稳定所引起的,误测较多(要用 PCI-E V2.0或以上规格主板验证),不然就主要是GPU引起的,我们可以 先加热,不行再更换GPU。d. 50578、50579分别为I2C总线的SCL和SDA信号线故障引起的,我们可测 量该两种信号线的对地阻值,将相关元件逐一排查。e. 92代码意为丧失能力的用户介面,不能进入测试程序,大多为花屏的变向表
17、现,可逐一检测所有显存的基准电压偏置电阻,看是否有少料,错料等;也 有GPU或显存功能坏引起此故障,可交叉改变GPU和显存频率从高到低或 者从低到高去叛断是否它是GPU或者是显存,从而判定是那边频率FAIL。 保持GPU频率不变,降低显存频率, 如果能Pass,则可能是显存问题; 如果怀 疑是显存问题, 可以运行Debug命令Test #3, Test #19 、Test #27或 Test #92去找出失败的显存。对于详细的信息, 请参考以下命令: mods gputest.js -mfg -nvclk xxx -hotclk xxx -mclk xxx test 92 matsinfo f
18、. 对于一些不稳定的GPU和显存, 请增加循环的次数去查找根本的原因.7.死机或中断: a. 检查各电源IC是否有引脚虚焊,翘脚, 错误的极性,,错件等等. b. 用万用表检查各组电压及电源IC周边原件是否正常。 c. 运行mats e 1检测是否因为花屏引起的死机故障。 d. 用命令mods gputest.js -mfg -nvclk xxx -hotclk xxx -mclk xxx 运行FCT测试,在死机时检测各供电电压,看在死机时是否正常。 e. 交叉改变GPU和显存频率从高到低或者从低到高,去判断是GPU坏或者 是显存坏。 f. 保持GPU频率不变,降低显存频率, 如果能Pass,
19、则可能是显存问题;如果 怀疑是显存问题, 可能运行Debug命令Test #3 , test #19, test #27 或test #92去找出失败显存.先设置相应的mclk xxx频率;对于被怀疑的 显存, 可先用加热, 如果不好, 再替换它. g.保持显存频率不变,降低GPU频率, 如果能Pass,则可能是GPU问题; 先 设置相应的nvclk xxx频率. 对于被怀疑的GPU, 可先用机器加热, 如果不 好, 再替换它. h.如果降低GPU和显存两个频率这块板才能Pass,应该检查GPU和显存的 供电电源. 如果电源功率不够,电流不够, 将会导致这个故障。 i. 如果test #3, test #19, test #27或test #92不能找到任何失败信息, 可运行mods s进一步查找, 请参考下列的详细命令: Mods s Mats.Run() WfMats.Run() FastMats.Run() 要能够根据实际的状况去设置相应的频率增加或减少GPU和显存频率, 反复运行这些命令去查找失败信息。 使用下列的命令去查找运行的结果 Mats.Status() WfMats.Status() FastMats.Run()8.常用nvflash命令:
限制150内