临床科研中正确抉择统计学方法.ppt





《临床科研中正确抉择统计学方法.ppt》由会员分享,可在线阅读,更多相关《临床科研中正确抉择统计学方法.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共83页现在学习的是第2页,共83页l统计描述统计描述统计指标、统计图或统计表统计指标、统计图或统计表均数、标准差、率、构成比均数、标准差、率、构成比l统计推断(参数估计、假设检验)统计推断(参数估计、假设检验)l相关分析相关分析以相关系数来衡量各因素间的密切程度和方向以相关系数来衡量各因素间的密切程度和方向l回归分析回归分析研究某因素与另一因素的依存关系研究某因素与另一因素的依存关系现在学习的是第3页,共83页数值变量资料计量资料数值变量资料计量资料无序分类变量资料计数资料无序分类变量资料计数资料 有序分类变量资料等级资料有序分类变量资料等级资料注意:不宜将定量资料转化为
2、分类资料注意:不宜将定量资料转化为分类资料现在学习的是第4页,共83页l每一种科研设计方法都有与之相适应的统计每一种科研设计方法都有与之相适应的统计方法方法l成组设计成组设计t t检验检验l配对配对t t检验检验l条件条件LogisticLogistic回归回归l非条件非条件LogisticLogistic回归回归现在学习的是第5页,共83页l数理统计与概率论是统计的理论基础数理统计与概率论是统计的理论基础l只有当某个或某些条件满足时,某个数理只有当某个或某些条件满足时,某个数理统计统计公式才成立统计统计公式才成立l涉及最多是数据分布特征涉及最多是数据分布特征l其次方差齐性其次方差齐性l理论数
3、大小理论数大小现在学习的是第6页,共83页现在学习的是第7页,共83页l描述集中趋势的指标,用以反映一组数描述集中趋势的指标,用以反映一组数据的平均水平据的平均水平l描述离散程度的指标,用以反映一组数描述离散程度的指标,用以反映一组数据的变异大小据的变异大小(两类指标的联合应用才能全面描述一组(两类指标的联合应用才能全面描述一组数值变量的基本特征)数值变量的基本特征)现在学习的是第8页,共83页指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极
4、差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小现在学习的是第9页,共83页l均数与标准差联合使用描述正态分布或均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征近似正态分布资料的基本特征l中位数与四分位数间距联合使用描述偏中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征态分布或未知分布资料的基本特征l最为常见的错误是不考虑这些指标的适最为常见的错误是不考虑这些指标的适用范围和条件的滥用用范围和条件的滥用现在学习的是第10页,共83页l以比代率,即误将构成比(以比代率,即误将构成比(proportionproportion)当作率(当作率(rat
5、erate)来描述某病发生的强度和)来描述某病发生的强度和频率频率l把各种不同的率相混淆,如把患病率与把各种不同的率相混淆,如把患病率与发病率、死亡率与病死率等概念混同发病率、死亡率与病死率等概念混同现在学习的是第11页,共83页指标名称计算公式意义率发生某现象的观察单位数可能发生某现象的观察单位数描述事件发生的强度和频率构成比A100%AB.事物内部各组成部分所占的比重发病率Incidence一年内发生的某病新病例数同年平均人口数在一定时间(一般为1年)内,某人群中发生某种疾病的新病例频率。患病率(现患率)Prevalence某特定时间内某人群中发现有某种疾病者的比例。死亡率Mortalit
6、y死亡率=一年内总死亡数同年平均人口数 在一定时间(一般为1年)内,某人群中死亡的频率。病死率Case fatality ra tio因某病死亡人数患该病的总数 患某病者中因该病死亡者占的比例。现在学习的是第12页,共83页现在学习的是第13页,共83页l样本数据间的不同有两种原因所致样本数据间的不同有两种原因所致样本来自同一总体,样本指标间的不同是样本来自同一总体,样本指标间的不同是由于抽样误差所引起由于抽样误差所引起1. 1.样本分别来自不同的总体,其样本指标间样本分别来自不同的总体,其样本指标间的不同是由于来源于不同的总体所致的不同是由于来源于不同的总体所致现在学习的是第14页,共83页
7、l假设检验是反证法原理的统计应用假设检验是反证法原理的统计应用l假设两个样本均数可能来源于同一总体,假设两个样本均数可能来源于同一总体,然后计算出在此假设下的某个统计量的然后计算出在此假设下的某个统计量的大小,当这个统计量在其分布中的概率大小,当这个统计量在其分布中的概率较小时(如较小时(如p0.05p0.05)我们就拒绝其假设,)我们就拒绝其假设,而接受其对立假设,认为两样本分别来而接受其对立假设,认为两样本分别来自不同的总体。自不同的总体。现在学习的是第15页,共83页l建立检验假设(三个内容)建立检验假设(三个内容)无效假设(无效假设(null hypothesisnull hypoth
8、esis)H H0 0备择假设(备择假设(alternative hypothesisalternative hypothesis)H H1 1检验水准(检验水准(size of testsize of test) l计算统计量计算统计量1. 1.根据统计量的值来得到概率(根据统计量的值来得到概率(p p)值;)值;再按概率值的大小得出结论再按概率值的大小得出结论现在学习的是第16页,共83页l前提前提研究者需要通过样本的信息去推断总体的研究者需要通过样本的信息去推断总体的结论结论1. 1.各样本资料对其总体应具有良好的代表性各样本资料对其总体应具有良好的代表性现在学习的是第17页,共83页l
9、假设检验的概率大小与结论的关系假设检验的概率大小与结论的关系当当p p 时,概率越小,越有理由拒绝时,概率越小,越有理由拒绝H H0 0假假设(无差别的假设),即拒绝设(无差别的假设),即拒绝H H0 0假设的可假设的可信程度就越大信程度就越大注意:当注意:当p p 时,不能说时,不能说“概率越小,组概率越小,组间的差别就越大间的差别就越大”现在学习的是第18页,共83页l假设检验的结论不能绝对化假设检验的结论不能绝对化在作出结论时,要避免使用绝对的或肯定的在作出结论时,要避免使用绝对的或肯定的语句语句当当p p 时,只要时,只要p0p0,我们无法完全拒绝,我们无法完全拒绝无差别的假设,即不能
10、肯定各总体间有差别无差别的假设,即不能肯定各总体间有差别当当p p 时,只要时,只要p1p1,我们无法完全接受,我们无法完全接受无差别的假设,即不能肯定各总体间无差别无差别的假设,即不能肯定各总体间无差别现在学习的是第19页,共83页l两组与多组比较两组与多组比较两组比较:两组比较:t t检验、检验、u u检验、两组秩和检验、检验、两组秩和检验、四格表和较正四格表的四格表和较正四格表的X2X2检验等检验等多组比较:方差分析、多组秩和检验、行多组比较:方差分析、多组秩和检验、行乘列乘列X2X2检验等(也可用于两组比较)检验等(也可用于两组比较)1. 1.注意:错误使用两组比较的方法代替多组注意:
11、错误使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较比较的情况并不少见,如,三个均数比较用三个用三个t t检验、四个检验、四个t t检验检验现在学习的是第20页,共83页l假设检验结论的两类错误假设检验结论的两类错误当当p p 时,做出时,做出“拒绝其无差别的假设,可认为各总体拒绝其无差别的假设,可认为各总体间有差别间有差别”的结论时就有可能犯错误,这类错误称为第的结论时就有可能犯错误,这类错误称为第一类错误(一类错误(type errortype error)其犯错误的概率用)其犯错误的概率用 表示,若表示,若 取取0.050.05,此时犯,此时犯型错误的概率型错误的概率0.0
12、50.05,若假设检验,若假设检验的的p p值比值比0.050.05越小,犯第一类错误的概率就越小。越小,犯第一类错误的概率就越小。1. 1.当当p p 时,做出时,做出“不拒绝其无差别的假设,还不能认为各不拒绝其无差别的假设,还不能认为各总体间有差别总体间有差别”的结论时就有可能犯第二类错误(的结论时就有可能犯第二类错误(type type )其犯错误的概率用其犯错误的概率用 表示,通常表示,通常 为未知数,但假设检验为未知数,但假设检验p p值越大,犯第二类错误的概率就越小值越大,犯第二类错误的概率就越小现在学习的是第21页,共83页l注意:当认为干预有负影响时,应使用注意:当认为干预有负
13、影响时,应使用双侧检验法。除非你有非常可信的证据双侧检验法。除非你有非常可信的证据证明这种差异仅在一个方向存在,否则,证明这种差异仅在一个方向存在,否则,你需要用双侧检验法。你需要用双侧检验法。现在学习的是第22页,共83页l计量资料的假设检验计量资料的假设检验l计数资料的假设检验计数资料的假设检验l等级资料的假设检验等级资料的假设检验现在学习的是第23页,共83页比较目的应用条件统计方法样本与总体比较例数较大u检验例数较小t检验两组资料的比较(完全随机设计)例数较大u检验例数较小,来自正态分布且方差齐成组设计的t检验例数较小且非正态分布或方差不齐成组设计的秩和检验中位数检验现在学习的是第24
14、页,共83页l单个自变量资料的统计学分析方法l自变量 因变量 统计方法l属性 属性 卡方 (2) 检验l二分 (属性) 数值 t-检验l多分 (属性) 数值 方差分析l属性 数值 (有截缩) 寿命表法 / 积限法l数值 数值 回归 (或相关) 分析现在学习的是第25页,共83页l两个或以上自变量资料的统计学分析方法l自变量 因变量 统计方法l属性 属性 对数-线性l属性或数值 属性 (二分) logistic回归l属性或数值 属性 (多分) 判别分析l属性 数值 方差分析l数值 数值 多元回归l数值或属性 数值 (有截缩) Cox回归l属性 (有混杂) 数值 协方差分析l数值 因子分析或聚类分
15、析现在学习的是第26页,共83页比较目的应用条件统计方法配对资料的比较例数较大(任意分布)配随设计u检验(配对设计)例数较小,差值来自正态配对设计的t检验例数较小,差值为非正态配对设计的秩和检验多组资料的比较各组均数来自正态分布且方差齐成组设计的方差分析(完全随机设计)各组为非正态分布且方差不齐成组设计的秩和检验配伍资料的比较各组均数来自正态分布且方差齐配伍设计的方差分析(配伍设计)各组为非正态分布且方差不齐配伍设计的秩和检验现在学习的是第27页,共83页比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的u检验两个率或构成比的比较(完全随机设计
16、)np5且n(1-p)5二项分布的u检验n40且T5四格表的X2检验n40且1T5较正四格表的X2检验n40或T40配对X2检验np5且n(1-p)5较正配对X2检验多个率或构成比的比较(完全随机设计)全部格子T5或少于1/5的格子1T5列联表的X2检验若有T1或有多于1/5的格子1T280971988027911815133407913264113928890合计230130360现在学习的是第45页,共83页q 象这样的行列表,我们可以将其分割成表象这样的行列表,我们可以将其分割成表3 3形式的四格表,分别形式的四格表,分别计算各指标,计算的结果见表计算各指标,计算的结果见表3 3。表表3
17、 3 各种界值的阳性率及假阳性率各种界值的阳性率及假阳性率 q由表由表3 3可见,灵敏度和假阳性率随界值的降低而生高,但特异度则随界可见,灵敏度和假阳性率随界值的降低而生高,但特异度则随界值的降低而降低。根据这样的关系,我们可以用假阳性率为横坐标,值的降低而降低。根据这样的关系,我们可以用假阳性率为横坐标,灵敏度为纵坐标做灵敏度为纵坐标做ROCROC曲线,见下图。曲线,见下图。 指标(%)界值280802794079139敏感度429399100特异度9988680假阳性率101232100现在学习的是第46页,共83页 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2
18、0.1 0(1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0(特异度特异度) ) 1.0 1.0 灵灵 0.9- 0.9- =40 =40 0.8- 80- 0.8- 80- 敏敏 0.7- 0.7- 0.6- 0.6- 度度 0.5- 0.5- 0.4- 280 0.4- 280 0.3- 0.3- 0.2- 0.2- 0.1 0.1 0 0曲线左上角灵敏度是曲线左上角灵敏度是1.01.0(100%100%),假阳性率是),假阳性率是0 0,即所有的病人全部被确诊,所有无病者都不会误,即所有的病人全部被确诊,所有无病者都不会误诊。距左上角距离越近的曲线实验效
19、果越好;诊。距左上角距离越近的曲线实验效果越好;在在ROCROC曲线上,靠坐上角距离最近的界点作为界值最好。(曲线上,靠坐上角距离最近的界点作为界值最好。(Q Q:为什么?)为什么?)在左上角处(灵敏度在左上角处(灵敏度+ +特异度)特异度)/2/2的值最大,可以根据此及实际工作的需要来确定具体诊断实验的的值最大,可以根据此及实际工作的需要来确定具体诊断实验的界值。界值。用用ROCROC曲线可以比较不同诊断实验的优劣(曲线可以比较不同诊断实验的优劣(Q Q:解释理由)。解释理由)。现在学习的是第47页,共83页2. 2. 似然比的临床应用似然比的临床应用l似然比似然比( (likelihood
20、 ratiolikelihood ratio) )是诊断试验综合评价的理是诊断试验综合评价的理想指标想指标, ,它综合了敏感度与特异度的临床意义它综合了敏感度与特异度的临床意义, ,而且而且可依据试验结果的阳性或阴性可依据试验结果的阳性或阴性, ,计算患病的概率计算患病的概率, ,便便于在诊断试验检测后于在诊断试验检测后, ,更确切地对患者作出诊断更确切地对患者作出诊断. .l真阳性率越高真阳性率越高, ,则阳性似然比越大则阳性似然比越大. .现在学习的是第48页,共83页CPK(u)AMI(+)AMI(-)+LRn比例n比例2809797/230=0.4211/130=0.010.42/0.
21、01=4280279118118/230=0.511515/130=0.120.51/0.12=4.2040791313/230=0.062626/130=0.200.06/0.20=0.3013922/230=0.018888/130=0.670.01/0.67=0.01合计230a/(a+c)130b/(b+d)现在学习的是第49页,共83页现在学习的是第50页,共83页现在学习的是第51页,共83页第三节第三节诊断性试验的评价原则诊断性试验的评价原则现在学习的是第52页,共83页1. 19811. 1981年确定的国际通用的评价原则年确定的国际通用的评价原则2. 19972. 1997年
22、年Trisha GreenhalghTrisha Greenhalgh在在BMJBMJ上提出的上提出的证实诊断试验有效的证实诊断试验有效的1010条问题条问题3. 20003. 2000年年SackettSackett在循证医学第二版提出的在循证医学第二版提出的8 8条原则条原则现在学习的是第53页,共83页1. 19811. 1981年确定的国际通用的评价原则年确定的国际通用的评价原则1.1 1.1 诊断性试验与金标准盲法比较和评价诊断性试验与金标准盲法比较和评价1.2 1.2 纳入研究病例的分析与评价纳入研究病例的分析与评价1.3 1.3 病例的来源和研究工作的安排是否作了叙述病例的来源和
23、研究工作的安排是否作了叙述1.4 1.4 诊断性试验的重复性及其临床意义是否明确诊断性试验的重复性及其临床意义是否明确1.5 1.5 诊断性试验所确定的正常值是否合理可靠诊断性试验所确定的正常值是否合理可靠1.6 1.6 在一系列试验中该诊断性试验是否最正确在一系列试验中该诊断性试验是否最正确1.7 1.7 诊断性试验的方法及重复性分析诊断性试验的方法及重复性分析1.8 1.8 诊断性试验的实用性如何诊断性试验的实用性如何现在学习的是第54页,共83页2. 19972. 1997年年Trisha GreenhalghTrisha Greenhalgh在在BMJBMJ上提出的证上提出的证实诊断试
24、验有效的实诊断试验有效的1010条问题条问题Q1: Is this test potentially relevant to my practice? Q1: Is this test potentially relevant to my practice? Q2: Has the test been compared with a true gold standard?Q2: Has the test been compared with a true gold standard?Q3: Did this validation study include an appropriate spe
25、ctrum of Q3: Did this validation study include an appropriate spectrum of subjects?subjects?Q4: Has workup bias been avoided?Q4: Has workup bias been avoided?Q5: Has expectation bias been avoided?Q5: Has expectation bias been avoided?Q6: Was the test shown to be reproducible?Q6: Was the test shown t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床 科研 正确 抉择 统计学 方法

限制150内