欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    常见统计学错误.ppt

    • 资源ID:84133048       资源大小:4.94MB        全文页数:50页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    常见统计学错误.ppt

    关于常见统计学错误现在学习的是第1页,共50页1.终点指标过多终点指标过多,大海捞针大海捞针w临床试验时,不知道哪个指标在组与组间有差临床试验时,不知道哪个指标在组与组间有差异;异;“确定某个指标后,万一组间没有差异,岂不确定某个指标后,万一组间没有差异,岂不被动!被动!”w生理、生化、组织学、基因,都做;生理、生化、组织学、基因,都做;“内容丰富,显得水平高!内容丰富,显得水平高!”w许多仪器一下子可以做许多项目;许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪许多项目一一分析,哪个有意义,就报告哪个指标标个指标标”现在学习的是第2页,共50页错在哪里?错在哪里?w哪些指标可能有组间差异,必须心中有数。哪些指标可能有组间差异,必须心中有数。科研的结果应当预见科研的结果应当预见 假说是科研的灵假说是科研的灵魂魂 心中无数,不要心中无数,不要“先上马再说先上马再说”w指标多,实验工作量大。指标多,实验工作量大。大海捞针大海捞针 碰运气,不是科研碰运气,不是科研w指标多,翻来覆去分析,制造假阳性指标多,翻来覆去分析,制造假阳性 Nature杂志统计学指南:常见错误之一杂志统计学指南:常见错误之一 现在学习的是第3页,共50页为何翻来覆去分析,会制造假阳性?为何翻来覆去分析,会制造假阳性?现在学习的是第4页,共50页Nature常见错误之一常见错误之一w多重比较多重比较:对一组数据作多项比较时,必须对一组数据作多项比较时,必须说明如何校正说明如何校正 水平,以避免增大第一类错水平,以避免增大第一类错误的机会误的机会现在学习的是第5页,共50页应当如何?应当如何?w主要终点主要终点(primary end point):只能一个:只能一个 次要终点次要终点(secondary end point):可以几个可以几个,但勿过但勿过多多wBonfferoni 校正校正 当同一组数据同时作当同一组数据同时作k次分析时,若限定次分析时,若限定犯假阳性错误的概率总共不超过犯假阳性错误的概率总共不超过 ,则每次分析要用则每次分析要用 来控制假阳性的概率。来控制假阳性的概率。例例 现在学习的是第6页,共50页w事后分析(事后分析(Post hoc analysis)看到数据之后才想起来做的分析看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认其结果往往不能被进一步研究所确认w不鼓励事先并未计划的亚组分析和校正分析不鼓励事先并未计划的亚组分析和校正分析2.事后分析,见机行事事后分析,见机行事现在学习的是第7页,共50页为何不鼓励事后分析?为何不鼓励事后分析?w数据是现象,现象具有偶然性;数据是现象,现象具有偶然性;看到数据后进行的看到数据后进行的“分析分析”属于故作姿态,属于故作姿态,变偶然为变偶然为“必然必然”忽悠!忽悠!w看到数据后增加的看到数据后增加的“分析分析”,也属于多重,也属于多重分析,增加假阳性的机会分析,增加假阳性的机会现在学习的是第8页,共50页w必要的亚组分析有助于发现适应症,指导必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效混杂偏倚,公平、公正地比较疗效w亚组分析和校正分析必须事先在研究计划亚组分析和校正分析必须事先在研究计划 里规定,并说明理由;写文章时,申明这里规定,并说明理由;写文章时,申明这 类分析是事前计划好的类分析是事前计划好的w事后决定做的分析,如果想写,不能算是事后决定做的分析,如果想写,不能算是 正式结果,只能视为探索性分析。正式结果,只能视为探索性分析。应当如何?应当如何?现在学习的是第9页,共50页3.随机化,说而不做,做而不严随机化,说而不做,做而不严w处理分配的随机化为什么这么重要处理分配的随机化为什么这么重要?(1)消除分配处理有意或无意的偏倚。消除分配处理有意或无意的偏倚。(2)为实施盲法创造条件。为实施盲法创造条件。(3)使有可能利用概率论来描述各干预组之间使有可能利用概率论来描述各干预组之间的差异有多大可能仅仅是由偶然性造成的。的差异有多大可能仅仅是由偶然性造成的。w将随机化当作将随机化当作“廉价名词廉价名词”,实际没做,却,实际没做,却写写“随机分成两组随机分成两组”科研道德?科研道德?现在学习的是第10页,共50页说错和做错说错和做错w将随机化当作将随机化当作“廉价名词廉价名词”,实际没做,却,实际没做,却写写“随机分成两组随机分成两组”科研道德?科研道德?w将将“随意分组随意分组”当作随机化当作随机化w将将“机械分组机械分组”当作随机化当作随机化w略去筛选过程,简单地报告将多少人随机分略去筛选过程,简单地报告将多少人随机分组组w略去实施过程中丢失对象,将最后两组人数略去实施过程中丢失对象,将最后两组人数说成是随机分组人数说成是随机分组人数现在学习的是第11页,共50页应当如何?应当如何?w成功的随机化取决于:成功的随机化取决于:(1)产生一个不可预见的分配序列产生一个不可预见的分配序列;(2)“隐蔽隐蔽”(allocation concealment)这个)这个序列,直到分配完毕(必须建立一个分配处序列,直到分配完毕(必须建立一个分配处理的系统)理的系统)。w报告如何随机分组,如何报告如何随机分组,如何“隐蔽隐蔽”:谁做随:谁做随机序列,谁收病人,谁分药和发药;分组方机序列,谁收病人,谁分药和发药;分组方案如何保管案如何保管现在学习的是第12页,共50页参加者的流程图参加者的流程图 (强烈推荐)(强烈推荐)合格对象合格对象82例例拒绝参与拒绝参与7例例随机分组随机分组75例例分配至实验组分配至实验组38例例接受干预接受干预38例例分配至对照组分配至对照组37例。接受例。接受干预干预36例例,1例因颈部损伤未例因颈部损伤未接受干预接受干预随随访访例例数数:7周周n=38,11周周n=38,15周周n=38,19周周n=36随随访访例例数数:7周周n=37,11周周n=36,15周周n=36,19周周n=35纳入分析例数纳入分析例数n=36排排除除分分析析例例数数n=2(因因失失访访)纳纳入入分分析析例例数数n=35,排排除除分分析析例例数数n=2(1例例失失访访,1例例颈颈部损伤)部损伤)现在学习的是第13页,共50页4.样本量随意决定样本量随意决定,无依据无依据w样本量太小?样本量太小?-真理应经得起重复真理应经得起重复 研究的功效太低研究的功效太低w样本量越大越好?样本量越大越好?-时间长、经费不足时间长、经费不足 不能保证数据质量不能保证数据质量w需要事先估算最小样本量需要事先估算最小样本量 论文必须报告估算最小样本量的根据论文必须报告估算最小样本量的根据 现在学习的是第14页,共50页比较两组测定值的均数比较两组测定值的均数现在学习的是第15页,共50页欧洲对比剂研究欧洲对比剂研究 (1)预计欲比较的两总体参数的差值)预计欲比较的两总体参数的差值(2)预计总体标准差)预计总体标准差 (3)允许出现假阳性结果的机会)允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会)允许出现假阴性结果的机会 现在学习的是第16页,共50页欧洲研究的样本量估算欧洲研究的样本量估算决定每组含决定每组含61名患者。名患者。现在学习的是第17页,共50页比较两组发生某结局的百分比比较两组发生某结局的百分比(1)预计两组发生某结局的百分比约为)预计两组发生某结局的百分比约为(2)允许犯假阳性错误的机会)允许犯假阳性错误的机会(3)允许犯假阴性错误的机会)允许犯假阴性错误的机会 现在学习的是第18页,共50页南韩研究南韩研究南韩对比剂研究南韩对比剂研究现在学习的是第19页,共50页南韩研究的样本量估算南韩研究的样本量估算现在学习的是第20页,共50页5剂量剂量-反应关系反应关系 不能作均数比较或回归不能作均数比较或回归例例 有人分析蛇毒因子(有人分析蛇毒因子(CVF)的剂量对血液白细)的剂量对血液白细胞噬菌率的影响,得如下数据,欲讨论剂量胞噬菌率的影响,得如下数据,欲讨论剂量-反应反应关系。关系。现在学习的是第21页,共50页 做法做法 1:单因素方差分析:单因素方差分析?!F=0.701,P0.5,均数间差别无统计学意义均数间差别无统计学意义 为什麽不对?为什麽不对?有负初衷有负初衷 探讨反应随剂量变化的趋势探讨反应随剂量变化的趋势*由多个剂量组的比较只能得知均数间是否有差异由多个剂量组的比较只能得知均数间是否有差异*有统计学差异也不等于有剂量有统计学差异也不等于有剂量-反应关系反应关系现在学习的是第22页,共50页 做法做法 2:反应的均数关于剂量作回归分析反应的均数关于剂量作回归分析?!为什麽不对?为什麽不对?均数做因变量造成均数做因变量造成“好好”的假象的假象!*回归方程是否有统计学意义与反应的变异状况有关回归方程是否有统计学意义与反应的变异状况有关*以诸个体反应值的均数作回归计算以诸个体反应值的均数作回归计算,掩盖变异性掩盖变异性回归方程:回归方程:Y=61.786-6.886 log(剂量剂量)决定系数:决定系数:R2=0.914。现在学习的是第23页,共50页正确作法:用个体资料作回归分析正确作法:用个体资料作回归分析回归方程:回归方程:Y=61.782-6.884 log(剂量剂量)决定系数:决定系数:R2=0.095回归方程无统计学意义,无剂量回归方程无统计学意义,无剂量-反应关系!反应关系!现在学习的是第24页,共50页6.重复测量资料不能时点间两两比较重复测量资料不能时点间两两比较例例 各取各取7只兔子,分别以正常食物和待研究食物喂只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养养,在实验前、喂养5周、周、10周后,各取血测量其中周后,各取血测量其中胆固醇浓度,自然对数转换后胆固醇浓度,自然对数转换后,数据见表数据见表22.1,问血清问血清胆固醇浓度随时间变化的趋势是否受该食物影响。胆固醇浓度随时间变化的趋势是否受该食物影响。现在学习的是第25页,共50页例例 某药物有新、旧两种剂型。为比较两种剂型的某药物有新、旧两种剂型。为比较两种剂型的代谢情况,对代谢情况,对16例某病患者服药后例某病患者服药后0、4、8、12小小时的血药浓度作了测量,问该药新旧两种剂型的时的血药浓度作了测量,问该药新旧两种剂型的血药浓度血药浓度-时间曲线的差别是否具有统计学意义。时间曲线的差别是否具有统计学意义。现在学习的是第26页,共50页现在学习的是第27页,共50页常见的不妥常见的不妥i)对每个时间点,分别计算均数、标准差;对每个时间点,分别计算均数、标准差;将各时间点测量值的均值用线连接,标出将各时间点测量值的均值用线连接,标出“误差误差”线线ii)在各时间点做两组比较在各时间点做两组比较(t 检验或非参数检验)检验或非参数检验)现在学习的是第28页,共50页为什麽不对?为什麽不对?(1)连接各时间点测量值均数的方法将掩盖个体曲)连接各时间点测量值均数的方法将掩盖个体曲线位置和形状的特点:线位置和形状的特点:各均数所对应的点连起来形成的曲线形状可能与各均数所对应的点连起来形成的曲线形状可能与诸个体的曲线形状毫不相干;诸个体的曲线形状毫不相干;各时间点标上相应的标准差也会误导;各时间点标上相应的标准差也会误导;(2)上述方法无法体现不同时间点的数据来自同一个体,)上述方法无法体现不同时间点的数据来自同一个体,而每一个体的多次重复测量值间具有相关性。(关键所而每一个体的多次重复测量值间具有相关性。(关键所在)在)现在学习的是第29页,共50页应当如何?应当如何?1)综合指标法()综合指标法(summary measures approach)或或 派生变量法(派生变量法(derived variable approach)w采用少数独立的综合指标来概括每个个体多个时间采用少数独立的综合指标来概括每个个体多个时间点的测量值;点的测量值;w用单变量方法比较各组的差异用单变量方法比较各组的差异现在学习的是第30页,共50页综合指标综合指标现在学习的是第31页,共50页2)重复测量资料的方差分析)重复测量资料的方差分析w 先做先做“球形检验:球形检验:不同时间点上数据之间没有相关性?不同时间点上数据之间没有相关性?任何两个时间点之间的相关性都一样?任何两个时间点之间的相关性都一样?w得阴性结果才进一步作方差分析。得阴性结果才进一步作方差分析。例例 兔子喂养重复测量资料分析兔子喂养重复测量资料分析1)处理因素(处理因素(group):):F=31.69,P=0.0001 食物对家兔血清胆固醇有影响;食物对家兔血清胆固醇有影响;2)测量时间(测量时间(time):):F=11.93,P=0.0003 家兔血清胆固醇浓度随时间变化;家兔血清胆固醇浓度随时间变化;3)交互效应(交互效应(timegroup):):F=10.57,P=0.0005 不同食物,血清胆固醇浓度变化趋势有所不同。不同食物,血清胆固醇浓度变化趋势有所不同。现在学习的是第32页,共50页7.多维列联表资料不可反复做多维列联表资料不可反复做 检验检验例例 某地区呼吸系统疾病的患病率较高,有人怀某地区呼吸系统疾病的患病率较高,有人怀疑与当地室内点香的习惯有关,经抽样调查,得疑与当地室内点香的习惯有关,经抽样调查,得数据如下数据如下现在学习的是第33页,共50页合并后作检验合并后作检验?!?!现在学习的是第34页,共50页为什麽不对?为什麽不对?i)点香与不点香者患病率不可比!点香与不点香者患病率不可比!年龄组合并掩盖了年龄组合并掩盖了:点香(点香(B1)与不点香()与不点香(B2)者年龄结构不同)者年龄结构不同ii)不同年龄组患病率不可比!不同年龄组患病率不可比!点香与不点香者合并掩盖了点香与不点香者合并掩盖了:不同年龄组中点香与不点香者比例的不同不同年龄组中点香与不点香者比例的不同现在学习的是第35页,共50页正确作法:正确作法:对数线性模型或对数线性模型或 logistic 回归回归i)对数线性模型对数线性模型平等地讨论平等地讨论A,B,C三因素对各格子中频数的影响三因素对各格子中频数的影响w仅当其他变量的影响与某变量无关时,才可通过合仅当其他变量的影响与某变量无关时,才可通过合并消除该变量并消除该变量ii)logistic回归回归 反应变量反应变量:患病与否,解释变量患病与否,解释变量:点香和年龄点香和年龄w交互效应交互效应:点香点香年龄年龄现在学习的是第36页,共50页8.中西医结合疗效研究,应设中西医结合疗效研究,应设 4 组组不少人作两组比较:不少人作两组比较:试验组:西药试验组:西药A和中药和中药B 对照组:西药对照组:西药A若若 (西药西药A和中药和中药B)疗效疗效 西药西药A 疗效疗效能说能说 中西医结合好吗中西医结合好吗?现在学习的是第37页,共50页不妥之一不妥之一 如果如果 (西药西药A和中药和中药B)疗效疗效 西药西药A 疗效疗效能说:能说:“在西药在西药A存在情形下,中药存在情形下,中药B有疗效有疗效”吗吗?人们质疑:人们质疑:“中药中药B的疗效可能是安慰效应的疗效可能是安慰效应!?”于是,修改为:试验组:西药于是,修改为:试验组:西药A和中药和中药B 对照组:西药对照组:西药A和中药安慰剂和中药安慰剂现在学习的是第38页,共50页不妥之二不妥之二若若 (西药西药A和中药和中药B)疗效疗效 (西药西药A和中药安慰剂和中药安慰剂)疗效疗效则可以说:则可以说:“在西药在西药A存在情形下,中药存在情形下,中药B有疗效!有疗效!”但是,人们要问:但是,人们要问:w在西药在西药A不存在情形下,中药不存在情形下,中药B有疗效吗?有疗效吗?w由此,足以认为中西医结合好吗?由此,足以认为中西医结合好吗?现在学习的是第39页,共50页 应当如何?应当如何?析因设计!析因设计!试验组试验组1:西药:西药A和中药和中药B试验组试验组2:西药:西药A和中药安慰剂和中药安慰剂 试验组试验组3:中药:中药B和西药安慰剂和西药安慰剂 对照组:中药安慰剂和西药安慰剂对照组:中药安慰剂和西药安慰剂若若 (西药西药A和中药和中药B)疗效疗效-对照疗效对照疗效 (西药西药A和中药安慰剂和中药安慰剂)疗效疗效-对照疗效对照疗效 +(中药中药B和西药安慰剂和西药安慰剂)疗效疗效-对照疗效对照疗效 则说:则说:中西医结合疗效比单独疗效之和还大!中西医结合疗效比单独疗效之和还大!现在学习的是第40页,共50页 换一个角度看换一个角度看若若 (西药西药A和中药和中药B)疗效疗效-对照疗效对照疗效 (西药西药A和中药安慰剂和中药安慰剂)疗效疗效-对照疗效对照疗效 +(中药中药B和西药安慰剂和西药安慰剂)疗效疗效-对照疗效对照疗效 改写为:改写为:(西药西药A和中药和中药B)疗效疗效-(中药中药B和西药安慰剂和西药安慰剂)疗效疗效 (西药西药A和中药和中药B安慰剂安慰剂)疗效疗效-对照疗效对照疗效中药中药B存在存在情形下,西药情形下,西药A的疗效的疗效 中药中药B不存在不存在情形下,西药情形下,西药A的疗效的疗效则说:中药则说:中药B的存在的存在使西药使西药A的疗效有所增加!的疗效有所增加!现在学习的是第41页,共50页 析因设计可以告诉我们什么?析因设计可以告诉我们什么?1.西药西药A的作用的作用 2.中药中药B的作用的作用3.西药西药A和中药和中药B的协同作用的协同作用若若 西药西药A和中药和中药B的协同作用的协同作用 0才说:才说:中西医结合好!中西医结合好!现在学习的是第42页,共50页例:某中西结合研究例:某中西结合研究 22析因试验结果析因试验结果(均数均数)现在学习的是第43页,共50页两因素间交互效应(两因素间交互效应(interaction)现在学习的是第44页,共50页小结小结1.终点指标不宜过多终点指标不宜过多,大海捞针,很可能捞大海捞针,很可能捞 上个假阳性。上个假阳性。2.马后炮分析不足取,事先计划的分析才马后炮分析不足取,事先计划的分析才可信;不论干预性研究还是观察性研究,可信;不论干预性研究还是观察性研究,都要事先到国际网站注册,以接受同行都要事先到国际网站注册,以接受同行监督。监督。3.随机化是国际公认的消除选择偏倚的好随机化是国际公认的消除选择偏倚的好办法,不可作为廉价名词,随便说说;办法,不可作为廉价名词,随便说说;说而不做,做而不严,自欺欺人。说而不做,做而不严,自欺欺人。现在学习的是第45页,共50页小结小结4.干预研究的论文要报告样本量估算的依据干预研究的论文要报告样本量估算的依据和方法;对不同的设计,样本量估算的方和方法;对不同的设计,样本量估算的方法不同。法不同。5.剂量剂量-反应关系既不能通过均数间比较,也反应关系既不能通过均数间比较,也不能用均数对剂量的回归来反映趋势,要不能用均数对剂量的回归来反映趋势,要用原始的反应值对剂量作回归。用原始的反应值对剂量作回归。现在学习的是第46页,共50页小结小结6.在多个时点对同一个体进行观察,得到的重复测在多个时点对同一个体进行观察,得到的重复测量资料能较好地反映个体的状况;要反映时间趋量资料能较好地反映个体的状况;要反映时间趋势,既不能作逐个时间点比较,也不能作回归,势,既不能作逐个时间点比较,也不能作回归,因为同一个体不同时点的观察资料互不独立。可因为同一个体不同时点的观察资料互不独立。可用几个综合指标逐一进行单指标分析或可用重复用几个综合指标逐一进行单指标分析或可用重复测量资料的方差分析测量资料的方差分析(先做球形检验先做球形检验)7.多维列联表资料不能盲目合并后反复做多维列联表资料不能盲目合并后反复做 检验,检验,可用对数线性模型或可用对数线性模型或 logistic回归模型研究分类变回归模型研究分类变量间关系。量间关系。现在学习的是第47页,共50页小结小结8.中西医结合疗效研究,通常只设两组:中西医结合疗效研究,通常只设两组:(西药和中药西药和中药)组组 与与 西药组西药组w不妥:只能说明在西药存在情形下,中药有不妥:只能说明在西药存在情形下,中药有 所贡献,但可以怀疑为安慰效应。所贡献,但可以怀疑为安慰效应。w (西药和中药西药和中药)组组 与与 (西药和中药安慰剂西药和中药安慰剂)组组不妥:可以说在西药存在情形下,中药有所贡不妥:可以说在西药存在情形下,中药有所贡献,但低估了中药的疗效。献,但低估了中药的疗效。建议中西医结合研究设置建议中西医结合研究设置4组,既可反映中药组,既可反映中药主效应,也可探索中西药之间有否协同效应。主效应,也可探索中西药之间有否协同效应。现在学习的是第48页,共50页参考书参考书1.方积乾等方积乾等.卫生统计学卫生统计学(第第7版)版).人民卫生人民卫生出版社出版社.20122.方积乾等方积乾等.医学统计学与电脑实验医学统计学与电脑实验(第第4版)版).上海科学技术出版社上海科学技术出版社.2012现在学习的是第49页,共50页感感谢谢大大家家观观看看现在学习的是第50页,共50页

    注意事项

    本文(常见统计学错误.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开