Bland-Altman分析在定量数据一致性评价中的应用.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《Bland-Altman分析在定量数据一致性评价中的应用.pdf》由会员分享,可在线阅读,更多相关《Bland-Altman分析在定量数据一致性评价中的应用.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3 0 8 方法介绍空国里生箕盐2 Q Q 2 生旦星2 1 鲞箜2 塑B l a n d A l t m a n 分析在临床测量方法一致性评价中的应用首都医科大学生物医学工程学院(1 0 0 0 6 9)陈卉在放射医学、超声医学、实验室医学等临床医学活动中,经常会遇到评价两种或多种检测、测量方法结果一致性(a g r e e m e n t)的问题。一般情况下,其中一种方法是目前广泛应用的或被称为“金标准”的方法,而另一种方法则是更先进、更便于应用、更经济、无创或微创的方法。通过对两种测量方法进行一致性评价可以回答“这两种方法能否互相替代”这样的问题。本文通过实例介绍用于评价测量结果为连续资
2、料的两种测量方法一致性的B l a n d A l t m a n 分析。原理和方法B l a n d A l t m a n 分析最初是由B l a n dJ M 和A l t m a nD G 于1 9 8 6 年提出的【2】。它的基本思想是计算出两种测量结果的一致性界限(1 i m i t so fa g r e e m e n t),并用图形的方法直观地反映这个一致性界限。最后结合临床实际,得出两种测量方法是否具有一致性的结论。1 一致性界限在进行两种方法的测定时,通常是对同一批受试对象同时进行测量。这两种方法一般不会获得完全相同的结果,总是存在着有一定趋势的差异,如一种方法的测量结果
3、经常大于(或小于)另一种方法的结果,这种差异被称为偏倚(b i a s)。偏倚可以用两种方法测定结果的差值的均数夏进行估计,五的变异情况则用差值的标准差S d 来描述。如果差值的分布服从正态分布,则9 5 的差值应该位于a 一1 9 6 S d 和五+1 9 6 S d之间。我们称这个区间为9 5 的一致性界限,绝大多数差值都位于该区间内。如果两种测量结果的差异位于一致性界限内在临床上是可以接受的,则可以认为这两种方法具有较好的一致性,这两种方法可以互换使用。如果两种测量方法中没有一种是“金标准”,或者不能确定哪种方法一定反映真实值,则可以用两种测量结果的平均值作为最终测量结果。当样本量较小时
4、,抽样误差会相对较大,因此还要给出9 5 一致性界限的上下限的置信区间。差值均数的标准误S E(刁)=S d,-竹,一致性界限的上、下限的标准误近似等于1 7 1 S E(2 1),则可以分别计算出一致性界限上限的9 5 置信区间和下限的9 5 置信区间【3,4 1。2 一致性界限的图形表示B l a n d A l t m a n 图B l a n d-A 1 t m a n 图以图形的方式反映一致性界限。在二维直角坐标中,用横轴z 表示两种方法测量每个对象的平均值,纵轴表示两种方法测量每个对象的差值,即可得到B l a n d A l t m a n 图(如图1 所示)。9 01 2 0T
5、赢亳三蚤!i:,工,O一:。p 帮opuoc)vOonOTooloo9 01 2 01 5 01 8 02 1 02 4 0测量均值(m m H g)图1 两种仪器测量8 5 名受试者血压的B l a n d A l t m a n 图图中上下两条水平实线代表9 5 一致性界限的上下限,中间实线代表差值的均数,虚线代表差值均数为0。两种测量方法的一致程度越高,代表差值均数的实线越接近代表差值均数为0 的虚线。根据9 5 一致性界限外的数据点数和一致性界限内的最大差值,以及临床上的可接受程度,对待评价的两种方法的一致性做出评价。B l a n d A l t m a n 图还清楚地显示了观察过程
6、中出现的极端情况,如图中最下方的两个点。3 用比值反映测量的一致性在临床实际应用中,除了用两种测量结果的差值反映一致性外,还可以用两种测量结果的比值来反映一致性。这时得到的是两种测量结果之间的比例关系。在求一致性界限时,先计算两种方法测量结果的比值,然后根据这些比值的均数和标准差计算一致性界限。实例分析1 原始数据如。如印一l目甚一培焖哪幕 万方数据C h i n e s eJ o u r n a lo fH e a l t hS t a t i s t i c s tJ u n2 0 0 V 0 1 2 4,N o 3在测量1 6 名检查者心功能指标左心室舒张末期容量(E D V)时,分别用
7、多次屏气电影法M R I(m E D v)和单次屏气电影法M R I(s E D V)进行测量,数据见表1。2 用差值进行B l a n d A l t m a n 分析表1 两种方法测量1 6 名检查者E D V 值(T I l l)1 6 例配对数据差值的均数i=一3 1 6m l,差值的标准差S d=1 4 3 5m l,则9 5 一致性界限为一3 1 6 1 9 6 1 4 3 5 m l,即(一3 1 7 3 m l,2 4 5 3 r r a),B l a n d 一砧t m a n 图如图2 所示。oO。毁旺一oVoooo图2 两种方法测量E D V 的B l a n d A l
8、 t m a n 图从图中可以看出,6 2 5(1 1 6)的点在9 5 一致性界限以外;在一致性界限范围内,单次屏气电影法测得的E D V 值(s E D V)与多次屏气电影法测得的E D V值(m E D V)相比,差值的绝对值最大为2 3 2 1m l(图中实心圆圈代表的点)。由于两种方法测量结果最多相差2 3 2 1m 1,两种方法测量结果平均为1 1 5 9 9m 1,这种相差的幅度在临床上可以接受,因此可以认为两种方法测量的结果具有较好的一致性,两种方法在临床上可以互相代替使用。3 用比值进行B l a n d A h m a n 分析如果在计算一致性界限时不是用测量结果的差值,而
9、是用测量结果的比值,则计算得比值的均数;=0 9 8,比值的标准差S,=0 1 2 5,则9 5 一致性界限为0 9 8 1 9 6 0 1 2 5,即(0 7 3,1 2 2)。将两种方法测量值的比值作为纵坐标,则得到图3 所示的B l a n d A l t m a n 图oooo 8 0一oooooID9 01 2 01 5 01 8 02 1 02 0囝3 根据两种方法测量值的比值绘制的B l a n d A l t m a n 图从图3 可以看出,1 3 5(2 1 6)的点在9 5 一致性界限以外;在一致性界限范围内,比值的最大值为1 0 8,最小值为0 8 3(图中实心圆圈代表的
10、点)。也就是说单次屏气法的测量值是多次屏气法测量值的0 8 3 到1 0 8 倍,即对于大多数受检者,单次屏气法的测量结果与多次屏气法测量结果相差8 到1 7。从临床上考虑,这种差异是可接受的,因此这两种方法具有较好的一致性。讨论1 B l a n d A l t m a n 图的绘制与结果解释B l a n d-A l t m a n 分析的特点就是图形化,因此B l a n d-A l t m a n 图的绘制至关重要。由于测量结果的差值或比值与每种方法的测量结果都有关,因此绘制B l a n d-A 1 t m a n 图时,横坐标应该是两种方法测量结果的平均值,而不应是某一种方法的测量
11、结果。B l a n d A l t m a n 图的纵坐标可以是两种方法测量结果的差值或比值,还可以是差值占均值的百分比,应根据实际的临床需要进行选择。对两种方法的一致性进行评价时,要以图形为参考,观察一致性界限外数据点的数量以及一致性界限内的最大值和最小值,从测量方法的临床应用出发,以测量结果的差异是否在临床上可被接受为依据,得出是否具有一致性的结论。2 B l a n d A l t m a n 分析与相关分析及配对t 检验对于表1 中的数据,从统计学上还可以进行相关分析和t 检验。相关分析回答的是“两种测量方法结(下转第3 1 5 页)_【日一增删器Q田8埽Q衄 万方数据主国里生缠盐2
12、 Q Q 2 生旦簦2 1 鲞亟塑系数。讨论在诊断试验的研究中,数据资料多为双向有序的列联表资料,这种资料可分为三种情况:一种情况是属性、分级水平数和分级水平都完全相同,此时可直接作k a p p a 检验。特别的,当分级都只有2 个水平时(如阳性与阴性),就成为配对设计的四格表资料,可使用配对x 2 检验,即M c N e m a r 检验。第二种情况是属性相同和分级水平数相同,但分级水平不全相同。如甲医生和乙医生都把病人的检查结果分为四个等级,但甲医生的分级为1,2,3,4,而乙医生的分级为2,3,4,5,在这种情况下,由于列联表的行数和列数仍然是一致的,所以仍可直接计算k a p p a
13、 统计量。第三种情况是属性相同,但分级水平数和分级水平不全相同。这种情况就是我们所说的列联表的行列数不一致。由于收集上来的数据不能轻易删除掉,所以可通过添加行或列使列联表成为方表,并将主对角线格点中的数值设为0 0 0 1,而其他格点均设为0,就可以使其成为方表,并计算k a p p a 统计量了。由于权值系数很小,所以不会影响k a p p a 值的计算结果。如果两个变量中有一个变量是金标准,则可以计算出敏感度、特异度、误诊率和漏诊率等评价指标。而目前大多数统计教材及参考书中仅给出四格表的计算方法,本文给出了行列表计算评价指标的方法,此方法可推广到,z 以行列表。如果有不同的诊断分界点,还可
14、以绘制出R O C 曲线 2|。诊断试验评价的统计学方法还会随着更多问题的提出和解决而不断得到发展、修正和扩展。参考文献1 马斌荣。主编医学科研中的统计方法北京:科学出版,2 0 0 5,32 宇传华译诊断医学统计学北京:人民卫生出版社,2 0 0 5,3(上接第3 0 9 页)果之间的密切程度如何”的问题,配对t 检验回答的是“两种测量结果的平均差值是否等于O”的问题。它们能否代替B l a n d A l t m a n 一致性分析呢?根据表1 中的数据绘制散点图,利用图形分析二者的相关性,见图4。从图中可以看出,两种方法测量的结果之间存在着直线相关关系(r=O 9 0 8)。同时数据中存
15、在着一个离群点(图中右上角的点),若去掉该离群点则相关系数变为r=O 7 8 3。由此可见采用相关系数分析两种测量方法之间的关系时,结果受离群点的影响较大。而采用B l a n d A l t m a n 一致性分析时,若去掉该离群点,9 5 一致性界限将变为(一3 2 4 0 m l,2 5 7 8 r n l),该范围只比原一致性界限范围扩大了1 9 2 m l。因此B l a n d A l t m a n 一致性分析方法更稳健。另一方面,二元相关分析与一元直线回归是等价的,是分析数据距回归直线Y=a X+b 的残差,通常情况下系数a i、b:O。而一致性检验是分析数据距a=1且b=O
16、的直线(图4 中的虚线)的误差,因此相关分析不能代替一致性检验。此外,对这组数据进行配对t 检验,得t=0 8 8 2,P=0 3 9 2 0 0 5。这一结果只能说明根据目前数据尚不能认为两种测量结果的平均差值不等于0,并不能充分反映它们之间的一致性。而且概率值P 受自由度的影响,同样的差值的均数和标准差,样本量越小,P 值越大。例如,如果将原始数据不加修改的重复5 次,则差值的均数仍为一3 1 6m l,标准差为1 3 9 8m l(略小于原始数据的标准差1 4 3 5m 1),经配对t 检验得P=0 0 4 6 0 0 5,于是得到了与前述结论相反的结论。因此用配对t 检验代替一致性检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Bland Altman 分析 定量 数据一致性 评价 中的 应用
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内