常见统计学错误.ppt
《常见统计学错误.ppt》由会员分享,可在线阅读,更多相关《常见统计学错误.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于常见统计学错误现在学习的是第1页,共50页1.终点指标过多终点指标过多,大海捞针大海捞针w临床试验时,不知道哪个指标在组与组间有差临床试验时,不知道哪个指标在组与组间有差异;异;“确定某个指标后,万一组间没有差异,岂不确定某个指标后,万一组间没有差异,岂不被动!被动!”w生理、生化、组织学、基因,都做;生理、生化、组织学、基因,都做;“内容丰富,显得水平高!内容丰富,显得水平高!”w许多仪器一下子可以做许多项目;许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪许多项目一一分析,哪个有意义,就报告哪个指标标个指标标”现在学习的是第2页,共50页错在哪里?错在哪里?w哪些
2、指标可能有组间差异,必须心中有数。哪些指标可能有组间差异,必须心中有数。科研的结果应当预见科研的结果应当预见 假说是科研的灵假说是科研的灵魂魂 心中无数,不要心中无数,不要“先上马再说先上马再说”w指标多,实验工作量大。指标多,实验工作量大。大海捞针大海捞针 碰运气,不是科研碰运气,不是科研w指标多,翻来覆去分析,制造假阳性指标多,翻来覆去分析,制造假阳性 Nature杂志统计学指南:常见错误之一杂志统计学指南:常见错误之一 现在学习的是第3页,共50页为何翻来覆去分析,会制造假阳性?为何翻来覆去分析,会制造假阳性?现在学习的是第4页,共50页Nature常见错误之一常见错误之一w多重比较多重
3、比较:对一组数据作多项比较时,必须对一组数据作多项比较时,必须说明如何校正说明如何校正 水平,以避免增大第一类错水平,以避免增大第一类错误的机会误的机会现在学习的是第5页,共50页应当如何?应当如何?w主要终点主要终点(primary end point):只能一个:只能一个 次要终点次要终点(secondary end point):可以几个可以几个,但勿过但勿过多多wBonfferoni 校正校正 当同一组数据同时作当同一组数据同时作k次分析时,若限定次分析时,若限定犯假阳性错误的概率总共不超过犯假阳性错误的概率总共不超过 ,则每次分析要用则每次分析要用 来控制假阳性的概率。来控制假阳性的
4、概率。例例 现在学习的是第6页,共50页w事后分析(事后分析(Post hoc analysis)看到数据之后才想起来做的分析看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认其结果往往不能被进一步研究所确认w不鼓励事先并未计划的亚组分析和校正分析不鼓励事先并未计划的亚组分析和校正分析2.事后分析,见机行事事后分析,见机行事现在学习的是第7页,共50页为何不鼓励事后分析?为何不鼓励事后分析?w数据是现象,现象具有偶然性;数据是现象,现象具有偶然性;看到数据后进行的看到数据后进行的“分析分析”属于故作姿态,属于故作姿态,变偶然为变偶然为“必然必然”忽悠!忽悠!w看到数据后增加的看到数
5、据后增加的“分析分析”,也属于多重,也属于多重分析,增加假阳性的机会分析,增加假阳性的机会现在学习的是第8页,共50页w必要的亚组分析有助于发现适应症,指导必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效混杂偏倚,公平、公正地比较疗效w亚组分析和校正分析必须事先在研究计划亚组分析和校正分析必须事先在研究计划 里规定,并说明理由;写文章时,申明这里规定,并说明理由;写文章时,申明这 类分析是事前计划好的类分析是事前计划好的w事后决定做的分析,如果想写,不能算是事后决定做的分析,如果想写,不能算是 正式结
6、果,只能视为探索性分析。正式结果,只能视为探索性分析。应当如何?应当如何?现在学习的是第9页,共50页3.随机化,说而不做,做而不严随机化,说而不做,做而不严w处理分配的随机化为什么这么重要处理分配的随机化为什么这么重要?(1)消除分配处理有意或无意的偏倚。消除分配处理有意或无意的偏倚。(2)为实施盲法创造条件。为实施盲法创造条件。(3)使有可能利用概率论来描述各干预组之间使有可能利用概率论来描述各干预组之间的差异有多大可能仅仅是由偶然性造成的。的差异有多大可能仅仅是由偶然性造成的。w将随机化当作将随机化当作“廉价名词廉价名词”,实际没做,却,实际没做,却写写“随机分成两组随机分成两组”科研道
7、德?科研道德?现在学习的是第10页,共50页说错和做错说错和做错w将随机化当作将随机化当作“廉价名词廉价名词”,实际没做,却,实际没做,却写写“随机分成两组随机分成两组”科研道德?科研道德?w将将“随意分组随意分组”当作随机化当作随机化w将将“机械分组机械分组”当作随机化当作随机化w略去筛选过程,简单地报告将多少人随机分略去筛选过程,简单地报告将多少人随机分组组w略去实施过程中丢失对象,将最后两组人数略去实施过程中丢失对象,将最后两组人数说成是随机分组人数说成是随机分组人数现在学习的是第11页,共50页应当如何?应当如何?w成功的随机化取决于:成功的随机化取决于:(1)产生一个不可预见的分配序
8、列产生一个不可预见的分配序列;(2)“隐蔽隐蔽”(allocation concealment)这个)这个序列,直到分配完毕(必须建立一个分配处序列,直到分配完毕(必须建立一个分配处理的系统)理的系统)。w报告如何随机分组,如何报告如何随机分组,如何“隐蔽隐蔽”:谁做随:谁做随机序列,谁收病人,谁分药和发药;分组方机序列,谁收病人,谁分药和发药;分组方案如何保管案如何保管现在学习的是第12页,共50页参加者的流程图参加者的流程图 (强烈推荐)(强烈推荐)合格对象合格对象82例例拒绝参与拒绝参与7例例随机分组随机分组75例例分配至实验组分配至实验组38例例接受干预接受干预38例例分配至对照组分配
9、至对照组37例。接受例。接受干预干预36例例,1例因颈部损伤未例因颈部损伤未接受干预接受干预随随访访例例数数:7周周n=38,11周周n=38,15周周n=38,19周周n=36随随访访例例数数:7周周n=37,11周周n=36,15周周n=36,19周周n=35纳入分析例数纳入分析例数n=36排排除除分分析析例例数数n=2(因因失失访访)纳纳入入分分析析例例数数n=35,排排除除分分析析例例数数n=2(1例例失失访访,1例例颈颈部损伤)部损伤)现在学习的是第13页,共50页4.样本量随意决定样本量随意决定,无依据无依据w样本量太小?样本量太小?-真理应经得起重复真理应经得起重复 研究的功效太
10、低研究的功效太低w样本量越大越好?样本量越大越好?-时间长、经费不足时间长、经费不足 不能保证数据质量不能保证数据质量w需要事先估算最小样本量需要事先估算最小样本量 论文必须报告估算最小样本量的根据论文必须报告估算最小样本量的根据 现在学习的是第14页,共50页比较两组测定值的均数比较两组测定值的均数现在学习的是第15页,共50页欧洲对比剂研究欧洲对比剂研究 (1)预计欲比较的两总体参数的差值)预计欲比较的两总体参数的差值(2)预计总体标准差)预计总体标准差 (3)允许出现假阳性结果的机会)允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会)允许出现假阴性结果的机会 现在学习的是第16页
11、,共50页欧洲研究的样本量估算欧洲研究的样本量估算决定每组含决定每组含61名患者。名患者。现在学习的是第17页,共50页比较两组发生某结局的百分比比较两组发生某结局的百分比(1)预计两组发生某结局的百分比约为)预计两组发生某结局的百分比约为(2)允许犯假阳性错误的机会)允许犯假阳性错误的机会(3)允许犯假阴性错误的机会)允许犯假阴性错误的机会 现在学习的是第18页,共50页南韩研究南韩研究南韩对比剂研究南韩对比剂研究现在学习的是第19页,共50页南韩研究的样本量估算南韩研究的样本量估算现在学习的是第20页,共50页5剂量剂量-反应关系反应关系 不能作均数比较或回归不能作均数比较或回归例例 有人
12、分析蛇毒因子(有人分析蛇毒因子(CVF)的剂量对血液白细)的剂量对血液白细胞噬菌率的影响,得如下数据,欲讨论剂量胞噬菌率的影响,得如下数据,欲讨论剂量-反应反应关系。关系。现在学习的是第21页,共50页 做法做法 1:单因素方差分析:单因素方差分析?!F=0.701,P0.5,均数间差别无统计学意义均数间差别无统计学意义 为什麽不对?为什麽不对?有负初衷有负初衷 探讨反应随剂量变化的趋势探讨反应随剂量变化的趋势*由多个剂量组的比较只能得知均数间是否有差异由多个剂量组的比较只能得知均数间是否有差异*有统计学差异也不等于有剂量有统计学差异也不等于有剂量-反应关系反应关系现在学习的是第22页,共50
13、页 做法做法 2:反应的均数关于剂量作回归分析反应的均数关于剂量作回归分析?!为什麽不对?为什麽不对?均数做因变量造成均数做因变量造成“好好”的假象的假象!*回归方程是否有统计学意义与反应的变异状况有关回归方程是否有统计学意义与反应的变异状况有关*以诸个体反应值的均数作回归计算以诸个体反应值的均数作回归计算,掩盖变异性掩盖变异性回归方程:回归方程:Y=61.786-6.886 log(剂量剂量)决定系数:决定系数:R2=0.914。现在学习的是第23页,共50页正确作法:用个体资料作回归分析正确作法:用个体资料作回归分析回归方程:回归方程:Y=61.782-6.884 log(剂量剂量)决定系
14、数:决定系数:R2=0.095回归方程无统计学意义,无剂量回归方程无统计学意义,无剂量-反应关系!反应关系!现在学习的是第24页,共50页6.重复测量资料不能时点间两两比较重复测量资料不能时点间两两比较例例 各取各取7只兔子,分别以正常食物和待研究食物喂只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养养,在实验前、喂养5周、周、10周后,各取血测量其中周后,各取血测量其中胆固醇浓度,自然对数转换后胆固醇浓度,自然对数转换后,数据见表数据见表22.1,问血清问血清胆固醇浓度随时间变化的趋势是否受该食物影响。胆固醇浓度随时间变化的趋势是否受该食物影响。现在学习的是第25页,共50页例例 某药
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常见 统计学 错误
限制150内