临床科研中正确抉择统计学方法PPT课件.ppt
《临床科研中正确抉择统计学方法PPT课件.ppt》由会员分享,可在线阅读,更多相关《临床科研中正确抉择统计学方法PPT课件.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于临床科研中正确抉择统计学方法第一张,PPT共八十三页,创作于2022年6月一、四个因素一、四个因素熟悉和掌握下述四个因素是正确进行统计分析熟悉和掌握下述四个因素是正确进行统计分析的基础的基础第二张,PPT共八十三页,创作于2022年6月(一)分析目的(一)分析目的l统计描述统计描述统计指标、统计图或统计表统计指标、统计图或统计表均数、标准差、率、构成比均数、标准差、率、构成比l统计推断(参数估计、假设检验)统计推断(参数估计、假设检验)l相关分析相关分析以相关系数来衡量各因素间的密切程度和方向以相关系数来衡量各因素间的密切程度和方向l回归分析回归分析研究某因素与另一因素的依存关系研究某因素
2、与另一因素的依存关系第三张,PPT共八十三页,创作于2022年6月(二)资料类型(二)资料类型数值变量资料计量资料数值变量资料计量资料无序分类变量资料计数资料无序分类变量资料计数资料 有序分类变量资料等级资料有序分类变量资料等级资料注意:不宜将定量资料转化为分类资料注意:不宜将定量资料转化为分类资料第四张,PPT共八十三页,创作于2022年6月(三)设计方法(三)设计方法l每一种科研设计方法都有与之相适应的每一种科研设计方法都有与之相适应的统计方法统计方法l成组设计成组设计t t检验检验l配对配对t t检验检验l条件条件LogisticLogistic回归回归l非条件非条件LogisticLo
3、gistic回归回归第五张,PPT共八十三页,创作于2022年6月(四)数理统计条件(四)数理统计条件l数理统计与概率论是统计的理论基础数理统计与概率论是统计的理论基础l只有当某个或某些条件满足时,某个数理统只有当某个或某些条件满足时,某个数理统计统计公式才成立计统计公式才成立l涉及最多是数据分布特征涉及最多是数据分布特征l其次方差齐性其次方差齐性l理论数大小理论数大小第六张,PPT共八十三页,创作于2022年6月二、数据资料的描述第七张,PPT共八十三页,创作于2022年6月(一)数值变量资料的描述(一)数值变量资料的描述l描述集中趋势的指标,用以反映一组数描述集中趋势的指标,用以反映一组数
4、据的平均水平据的平均水平l描述离散程度的指标,用以反映一组数描述离散程度的指标,用以反映一组数据的变异大小据的变异大小(两类指标的联合应用才能全面描述一组(两类指标的联合应用才能全面描述一组数值变量的基本特征)数值变量的基本特征)第八张,PPT共八十三页,创作于2022年6月描述数值变量资料的常用指标描述数值变量资料的常用指标指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小
5、第九张,PPT共八十三页,创作于2022年6月l均数与标准差联合使用描述正态分布或均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征近似正态分布资料的基本特征l中位数与四分位数间距联合使用描述偏中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征态分布或未知分布资料的基本特征l最为常见的错误是不考虑这些指标的适最为常见的错误是不考虑这些指标的适用范围和条件的滥用用范围和条件的滥用第十张,PPT共八十三页,创作于2022年6月(二)分类变量资料的描述l以比代率,即误将构成比(以比代率,即误将构成比(proportionproportion)当作率(当作率(raterate)
6、来描述某病发生的强度和)来描述某病发生的强度和频率频率l把各种不同的率相混淆,如把患病率与把各种不同的率相混淆,如把患病率与发病率、死亡率与病死率等概念混同发病率、死亡率与病死率等概念混同第十一张,PPT共八十三页,创作于2022年6月描述分类变量资料的常用指标描述分类变量资料的常用指标指标名称计算公式意义率发生某现象的观察单位数可能发生某现象的观察单位数描述事件发生的强度和频率构成比A100%AB.事物内部各组成部分所占的比重发病率Incidence一年内发生的某病新病例数同年平均人口数在一定时间(一般为1年)内,某人群中发生某种疾病的新病例频率。患病率(现患率)Prevalence某特定时
7、间内某人群中发现有某种疾病者的比例。死亡率Mortality死亡率=一年内总死亡数同年平均人口数 在一定时间(一般为1年)内,某人群中死亡的频率。病死率Case fatality ra tio因某病死亡人数患该病的总数 患某病者中因该病死亡者占的比例。第十二张,PPT共八十三页,创作于2022年6月三、数据资料的比较三、数据资料的比较第十三张,PPT共八十三页,创作于2022年6月(一)假设检验的基本思想l样本数据间的不同有两种原因所致样本数据间的不同有两种原因所致1.1.样本来自同一总体,样本指标间的不同是样本来自同一总体,样本指标间的不同是由于抽样误差所引起由于抽样误差所引起2.2.样本分
8、别来自不同的总体,其样本指标间样本分别来自不同的总体,其样本指标间的不同是由于来源于不同的总体所致的不同是由于来源于不同的总体所致第十四张,PPT共八十三页,创作于2022年6月l假设检验是反证法原理的统计应用假设检验是反证法原理的统计应用l假设两个样本均数可能来源于同一总体,假设两个样本均数可能来源于同一总体,然后计算出在此假设下的某个统计量的然后计算出在此假设下的某个统计量的大小,当这个统计量在其分布中的概率大小,当这个统计量在其分布中的概率较小时(如较小时(如p0.05p0.05)我们就拒绝其假设,)我们就拒绝其假设,而接受其对立假设,认为两样本分别来而接受其对立假设,认为两样本分别来自
9、不同的总体。自不同的总体。第十五张,PPT共八十三页,创作于2022年6月(二)假设检验的基本步骤(二)假设检验的基本步骤l建立检验假设(三个内容)建立检验假设(三个内容)1.1.无效假设(无效假设(null hypothesisnull hypothesis)H H0 02.2.备择假设(备择假设(alternative hypothesisalternative hypothesis)H H1 13.3.检验水准(检验水准(size of testsize of test)l计算统计量计算统计量l根据统计量的值来得到概率(根据统计量的值来得到概率(p p)值;)值;再按概率值的大小得出结论
10、再按概率值的大小得出结论第十六张,PPT共八十三页,创作于2022年6月(三)假设检验的注意事项l前提前提1.1.研究者需要通过样本的信息去推断总体的研究者需要通过样本的信息去推断总体的结论结论2.2.各样本资料对其总体应具有良好的代表性各样本资料对其总体应具有良好的代表性第十七张,PPT共八十三页,创作于2022年6月l假设检验的概率大小与结论的关系假设检验的概率大小与结论的关系1.1.当当p p 时,概率越小,越有理由拒绝时,概率越小,越有理由拒绝H H0 0假假设(无差别的假设),即拒绝设(无差别的假设),即拒绝H H0 0假设的可假设的可信程度就越大信程度就越大2.2.注意:当注意:当
11、p p 时,不能说时,不能说“概率越小,组概率越小,组间的差别就越大间的差别就越大”第十八张,PPT共八十三页,创作于2022年6月l假设检验的结论不能绝对化假设检验的结论不能绝对化在作出结论时,要避免使用绝对的或肯定的在作出结论时,要避免使用绝对的或肯定的语句语句当当p p 时,只要时,只要p0p0,我们无法完全拒绝,我们无法完全拒绝无差别的假设,即不能肯定各总体间有差别无差别的假设,即不能肯定各总体间有差别当当p p 时,只要时,只要p1p1,我们无法完全接受,我们无法完全接受无差别的假设,即不能肯定各总体间无差别无差别的假设,即不能肯定各总体间无差别第十九张,PPT共八十三页,创作于20
12、22年6月l两组与多组比较两组与多组比较1.1.两组比较:两组比较:t t检验、检验、u u检验、两组秩和检验、检验、两组秩和检验、四格表和较正四格表的四格表和较正四格表的X2X2检验等检验等2.2.多组比较:方差分析、多组秩和检验、行多组比较:方差分析、多组秩和检验、行乘列乘列X2X2检验等(也可用于两组比较)检验等(也可用于两组比较)3.3.注意:错误使用两组比较的方法代替多组注意:错误使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较比较的情况并不少见,如,三个均数比较用三个用三个t t检验、四个检验、四个t t检验检验第二十张,PPT共八十三页,创作于2022年6月l假设检
13、验结论的两类错误假设检验结论的两类错误1.1.当当p p 时,做出时,做出“拒绝其无差别的假设,可认为各总体拒绝其无差别的假设,可认为各总体间有差别间有差别”的结论时就有可能犯错误,这类错误称为第的结论时就有可能犯错误,这类错误称为第一类错误(一类错误(type errortype error)其犯错误的概率用)其犯错误的概率用 表示,若表示,若 取取0.050.05,此时犯,此时犯型错误的概率型错误的概率0.050.05,若假设检验,若假设检验的的p p值比值比0.050.05越小,犯第一类错误的概率就越小。越小,犯第一类错误的概率就越小。2.2.当当p p 时,做出时,做出“不拒绝其无差别
14、的假设,还不能认不拒绝其无差别的假设,还不能认为各总体间有差别为各总体间有差别”的结论时就有可能犯第二类错误的结论时就有可能犯第二类错误(type type)其犯错误的概率用)其犯错误的概率用 表示,通常表示,通常 为未知数,为未知数,但假设检验但假设检验p p值越大,犯第二类错误的概率就越小值越大,犯第二类错误的概率就越小第二十一张,PPT共八十三页,创作于2022年6月l注意:当认为干预有负影响时,应使用注意:当认为干预有负影响时,应使用双侧检验法。除非你有非常可信的证据双侧检验法。除非你有非常可信的证据证明这种差异仅在一个方向存在,否则,证明这种差异仅在一个方向存在,否则,你需要用双侧检
15、验法。你需要用双侧检验法。第二十二张,PPT共八十三页,创作于2022年6月(四)常用的假设检验方法(四)常用的假设检验方法l计量资料的假设检验计量资料的假设检验l计数资料的假设检验计数资料的假设检验l等级资料的假设检验等级资料的假设检验第二十三张,PPT共八十三页,创作于2022年6月1 1 1 1、常用计量资料的假设检验、常用计量资料的假设检验比较目的应用条件统计方法样本与总体比较例数较大u检验例数较小t检验两组资料的比较(完全随机设计)例数较大u检验例数较小,来自正态分布且方差齐成组设计的t检验例数较小且非正态分布或方差不齐成组设计的秩和检验中位数检验第二十四张,PPT共八十三页,创作于
16、2022年6月统计学处理方法的选择统计学处理方法的选择 l单个自变量资料的统计学分析方法l自变量 因变量 统计方法l属性 属性 卡方(2)检验l二分(属性)数值 t-检验l多分(属性)数值 方差分析l属性 数值(有截缩)寿命表法/积限法l数值 数值 回归(或相关)分析第二十五张,PPT共八十三页,创作于2022年6月统计学处理方法的选择统计学处理方法的选择l两个或以上自变量资料的统计学分析方法l自变量 因变量 统计方法l属性 属性 对数-线性l属性或数值 属性(二分)logistic回归l属性或数值 属性(多分)判别分析l属性 数值 方差分析l数值 数值 多元回归l数值或属性 数值(有截缩)C
17、ox回归l属性(有混杂)数值 协方差分析l数值 因子分析或聚类分析第二十六张,PPT共八十三页,创作于2022年6月1 1、常用计量资料的假设检验(续表)、常用计量资料的假设检验(续表)、常用计量资料的假设检验(续表)、常用计量资料的假设检验(续表)比较目的应用条件统计方法配对资料的比较例数较大(任意分布)配随设计u检验(配对设计)例数较小,差值来自正态配对设计的t检验例数较小,差值为非正态配对设计的秩和检验多组资料的比较各组均数来自正态分布且方差齐成组设计的方差分析(完全随机设计)各组为非正态分布且方差不齐成组设计的秩和检验配伍资料的比较各组均数来自正态分布且方差齐配伍设计的方差分析(配伍设
18、计)各组为非正态分布且方差不齐配伍设计的秩和检验第二十七张,PPT共八十三页,创作于2022年6月2 2 2 2、常用计数资料假设检验方法、常用计数资料假设检验方法比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的u检验两个率或构成比的比较(完全随机设计)np5且n(1-p)5二项分布的u检验n40且T5四格表的X2检验n40且1T5较正四格表的X2检验n40或T40配对X2检验np5且n(1-p)5较正配对X2检验多个率或构成比的比较(完全随机设计)全部格子T5或少于1/5的格子1T5列联表的X2检验若有T1或有多于1/5的格子1T28097
19、1988027911815133407913264113928890合计230130360第四十五张,PPT共八十三页,创作于2022年6月q 象象这这样样的的行行列列表表,我我们们可可以以将将其其分分割割成成表表3 3形形式式的的四四格格表表,分分别别计计算各指标,计算的结果见表算各指标,计算的结果见表3 3。表表3 3 各种界值的阳性率及假阳性率各种界值的阳性率及假阳性率 q由由表表3 3可可见见,灵灵敏敏度度和和假假阳阳性性率率随随界界值值的的降降低低而而生生高高,但但特特异异度度则则随随界界值值的的降降低低而而降降低低。根根据据这这样样的的关关系系,我我们们可可以以用用假假阳阳性性率率
20、为为横横坐标,灵敏度为纵坐标做坐标,灵敏度为纵坐标做ROCROC曲线,见下图。曲线,见下图。指标(%)界值280802794079139敏感度429399100特异度9988680假阳性率101232100第四十六张,PPT共八十三页,创作于2022年6月 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0(1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0(特异度特异度)1.0 1.0 灵灵 0.9-0.9-=40=40 0.8-80-0.8-80-敏敏 0.7-0.7-0.6-0.6-度度 0.5-0.5-0.4-280 0.
21、4-280 0.3-0.3-0.2-0.2-0.1 0.1 0 0a.a.曲线左上角灵敏度是曲线左上角灵敏度是1.01.0(100%100%),假阳性率是),假阳性率是0 0,即所有的病人全部被确诊,所有,即所有的病人全部被确诊,所有无病者都不会误诊。距左上角距离越近的曲线实验效果越好;无病者都不会误诊。距左上角距离越近的曲线实验效果越好;b.b.在在ROCROC曲线上,靠坐上角距离最近的界点作为界值最好。(曲线上,靠坐上角距离最近的界点作为界值最好。(Q Q:为什么?)为什么?)c.c.在左上角处(灵敏度在左上角处(灵敏度+特异度)特异度)/2/2的值最大,可以根据此及实际工作的需要来确定具
22、体诊断的值最大,可以根据此及实际工作的需要来确定具体诊断实验的界值。实验的界值。d.d.用用ROCROC曲线可以比较不同诊断实验的优劣(曲线可以比较不同诊断实验的优劣(Q Q:解释理由)。解释理由)。第四十七张,PPT共八十三页,创作于2022年6月2.2.似然比的临床应用似然比的临床应用l似然比似然比(likelihood ratiolikelihood ratio)是诊断试验综合评价的理想是诊断试验综合评价的理想指标指标,它综合了敏感度与特异度的临床意义它综合了敏感度与特异度的临床意义,而且可依据而且可依据试验结果的阳性或阴性试验结果的阳性或阴性,计算患病的概率计算患病的概率,便于在诊断试
23、便于在诊断试验检测后验检测后,更确切地对患者作出诊断更确切地对患者作出诊断.l真阳性率越高真阳性率越高,则阳性似然比越大则阳性似然比越大.第四十八张,PPT共八十三页,创作于2022年6月表表表表4 4 4 4 AMIAMIAMIAMI患者患者患者患者CPKCPKCPKCPK分层检测结果分层检测结果分层检测结果分层检测结果Q:Q:Q:Q:某患者男性某患者男性某患者男性某患者男性,40,40,40,40岁岁岁岁,活动后感胸前区疼痛活动后感胸前区疼痛活动后感胸前区疼痛活动后感胸前区疼痛,在医院查在医院查在医院查在医院查CPKCPKCPKCPK为为为为72727272u,u,u,u,问患问患问患问患
24、AMIAMIAMIAMI的可能的可能的可能的可能性有多大性有多大性有多大性有多大?(0.5,0.30,0.23)(0.5,0.30,0.23)(0.5,0.30,0.23)(0.5,0.30,0.23)CPK(u)AMI(+)AMI(-)+LRn比例n比例2809797/230=0.4211/130=0.010.42/0.01=4280279118118/230=0.511515/130=0.120.51/0.12=4.2040791313/230=0.062626/130=0.200.06/0.20=0.3013922/230=0.018888/130=0.670.01/0.67=0.01合
25、计230a/(a+c)130b/(b+d)第四十九张,PPT共八十三页,创作于2022年6月第五十张,PPT共八十三页,创作于2022年6月第五十一张,PPT共八十三页,创作于2022年6月第三节第三节诊断性试验的评价原则诊断性试验的评价原则第五十二张,PPT共八十三页,创作于2022年6月1.19811.1981年确定的国际通用的评价原则年确定的国际通用的评价原则2.19972.1997年年Trisha GreenhalghTrisha Greenhalgh在在BMJBMJ上提出的上提出的证实诊断试验有效的证实诊断试验有效的1010条问题条问题3.20003.2000年年SackettSac
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床 科研 正确 抉择 统计学 方法 PPT 课件
限制150内