医学科研设计与统计学思维.ppt
《医学科研设计与统计学思维.ppt》由会员分享,可在线阅读,更多相关《医学科研设计与统计学思维.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学科研设计与统计学思维医学科研设计与统计学思维浙江大学公共卫生学院沈 毅2013.11.5第一页,编辑于星期一:十二点 十分。没有设计的临床干预试验没有设计的临床干预试验 16851685年抢救英国国王查理二世(年抢救英国国王查理二世(Charles II Charles II,1630-16851630-1685):):“一一品品脱脱(0.568L0.568L)血血从从右右臂臂放放出出,半半品品脱脱血血从从左左肩肩放放出出,服服下下催催吐吐剂剂、两两付付汤汤药药和和一一种种由由1515成成份份的的灌灌肠肠剂剂。刮刮国国王王的的头头部部,直直到到起起一一个个大大泡泡。再再服服打打喷喷嚏嚏的的
2、药药粉粉和和更更多多的的催催吐吐剂剂。继继续续放放血血,加加服服止止痛痛剂剂。把把沥沥青青和和鸽鸽子子粪粪混混合合后后敷敷于于脚脚上上。服服一一种种含含有有1010种种成成份份的的草草药药。最最后后服服人人头头盖盖骨骨粉粉制制成成的的4040滴滴糖糖浆浆,外外敷敷牛牛黄黄。然后,国王陛下死了。然后,国王陛下死了。”第二页,编辑于星期一:十二点 十分。有设计的临床干预试验有设计的临床干预试验 1747年5月20日,英国的J.Lind医生将12名病情相同似的患者带到一艘船上。患者的主要症状是牙龈溃烂,皮肤有出血点,双膝无力。Lind将12名患者分为6组,分别给予下列主要干预:A组:每天饮1夸脱(1
3、.136L)苹果汁;B组:服25滴硫酸丹剂(elixir vitriol),每天3次;C组:服2匙醋,每天3次;D组:每天饮约半品脱海水,服缓和的泻药;E组:每天食2个桔子,一个柠檬;F组:每天服由大蒜、芥子等成份组成的干药。当当6 6月月1616日日船船返返回回英英国国PlymouthPlymouth港港时时,所所有有患患者者的的病病情情都都有有好好转转,其其中中E E组组恢恢复复的的最最快快、最最好好,其其中中一一人人到到第第6 6天天就就可可以以工工作作了了。B B组组也也有有一一人人比比登登船船时时健健康康。LindLind医医生生的的试试验验并并没没有有得得出出明明确确的的结结论论,
4、直直到到160160年年后后,通通过过动动物物实实验验才才真真正正从从科科学学意意义义上上解解释释了了E E组组疗疗效效最最好好的的真真正正原原因。因。第三页,编辑于星期一:十二点 十分。J.Lind医生的研究有二点符合统计学的设计:1、设立了对照(相互对照);2、质量控制(消除了一些混杂)。如果我们今天重复J.Lind的研究,在统计设计的上还需要做到以下几点:1、研究对象的定义与纳入标准和排除标准2、足够多的观察对象3、效应指标的选择4、结论是否能外推第四页,编辑于星期一:十二点 十分。“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”F.Yates,M.
5、J.R.Healy医学论文中的统计问题医学论文中的统计问题 统计知识的运用统计知识的运用 撰写论文:报告自己观察或实验的研究结果撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展阅读论文:吸收新知识,了解学术进展 1996年,对申报科技成果的年,对申报科技成果的4586篇科研论文分析,篇科研论文分析,统计方法使用率为统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。还可能导致严重的伦理学问题。第五页,编辑于星期一:十二点 十分。统计学方法用于干预试验统计学方法用于干预试验 18
6、35年,法国医生年,法国医生P.C.A.Louis 对当时流行的对当时流行的“放血放血”疗法治疗疗法治疗肺炎的效果进行了比较,发现肺炎的效果进行了比较,发现“放血放血”的疗效不象预期的那么好,而且早的疗效不象预期的那么好,而且早期期“放血放血”和晚期和晚期“放血放血”组比较,患者的诊断、病情、病程、年龄等方组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期面的差异很大,比较平均治愈时间意义不大。因为晚期“放血放血”组的平均组的平均治愈时间长,但该组患者病情重、病程长、年龄大。治愈时间长,但该组患者病情重、病程长、年龄大。Louis对医学研究的方法学作出了很
7、大贡献:对医学研究的方法学作出了很大贡献:(1)用数字的方法表示不同疾病患者的特征和预后;)用数字的方法表示不同疾病患者的特征和预后;(2)提出了临床疗效对比的前瞻性原则;)提出了临床疗效对比的前瞻性原则;(3)提出抽样误差和混杂()提出抽样误差和混杂(confounding)概念。其中前瞻性研)概念。其中前瞻性研究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法;究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法;(4)在)在J.Gavarret 的协助下,的协助下,Louis的数字方法发展为的数字方法发展为“概概率框架率框架”,Gavarret也于也于1840年在巴
8、黎出版了世界第一部医学年在巴黎出版了世界第一部医学统计学教科书。统计学教科书。第六页,编辑于星期一:十二点 十分。“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”F.Yates,M.J.R.Healy医学论文中的统计问题医学论文中的统计问题 统计知识的运用统计知识的运用 撰写论文:报告自己观察或实验的研究结果撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展阅读论文:吸收新知识,了解学术进展 1996年,对申报科技成果的年,对申报科技成果的4586篇科研论文分析,篇科研论文分析,统计方法使用率为统计方法使用率为76%。医学论文中统计
9、运用错误,除了影响论文的科学性,还医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。可能导致严重的伦理学问题。第七页,编辑于星期一:十二点 十分。“调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱厦中的一个
10、支柱”-JAMA-JAMA的编辑部的编辑部60年年代代到到80年年代代,国国外外医医学学杂杂志志调调查查结结果果:有有统统计计错错误误的的论论文文20%72%。1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华华妇妇产产科科杂杂志志、中中华华儿儿科科杂杂志志595篇篇论文的调查结果:论文的调查结果:相对数误用为相对数误用为11.2%抽样方法误用抽样方法误用15.9%统计图表误用统计图表误用11.7%1996年年对对4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数据分析方法误用达数据分析方法误用达55.7%。第
11、八页,编辑于星期一:十二点 十分。科学容不得半点虚假,造假者一旦被揭露就背上科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱了永远洗脱不掉的耻辱 。伪造统计数据违反科学道德伪造统计数据违反科学道德 据据1976年年New Science 杂志关于科研舞弊行为的调杂志关于科研舞弊行为的调查查74%的调查表反映有不正当修改数据的情况,其中,的调查表反映有不正当修改数据的情况,其中,17%拼凑实验结果,拼凑实验结果,7%凭空捏造数据,凭空捏造数据,2%故意曲解结果。故意曲解结果。就统计学本身来说,正确实验设计得出的统计结果,是就统计学本身来说,正确实验设计得出的统计结果,是用用P值作为
12、值作为“重现性重现性”的概率保证。的概率保证。P0.05,就是说实验,就是说实验结果显示的差别是机遇所致的可能性不足结果显示的差别是机遇所致的可能性不足5%,或者说,别,或者说,别人在同样的条件下重复同样的试验,得出相反结论的人在同样的条件下重复同样的试验,得出相反结论的可能性不足可能性不足5%。第九页,编辑于星期一:十二点 十分。1.采用统计学方法,发现不确定现象采用统计学方法,发现不确定现象背后隐藏的规律。背后隐藏的规律。变异变异(variation)是社会和生物医学中的普)是社会和生物医学中的普遍现象。遍现象。变异使得实验或观察的结果具有变异使得实验或观察的结果具有不确定性不确定性,如,
13、如每个人的身高、体重、血压等各有不同。每个人的身高、体重、血压等各有不同。一、为什么要学统计学?一、为什么要学统计学?第十页,编辑于星期一:十二点 十分。最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。第十一页,编辑于星期一:十二点 十分。2.用统计学思维方式考虑有关医学研究用统计学思维方式考虑有关医学研究中的问题中的问题 “阳性阳性”结果是否是虚假联系?结果是否是虚假联系?某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒药十分有效,能否说该感冒药十分有效?“阴性阴性”结果是否是样本含量不足?结果是否是样本含量不足?有人曾对发
14、表在有人曾对发表在Lancet,N Engl J Med,JAMA等著名医学等著名医学杂志上的杂志上的71篇阴性结果的论文作过分析,发现其中有篇阴性结果的论文作过分析,发现其中有62篇(篇(93%)可能是由于)可能是由于样本含量样本含量不足造成的假阴性。不足造成的假阴性。第十二页,编辑于星期一:十二点 十分。l如:当专业上有一定联系的两个变量之间的变化呈“S型”或“倒S型”曲线趋势时,若错误地用直线方程去描述,从统计学角度看效果也很好,但在专业上是解释不通的。再比如,某两个统计量(如均值、率等)之间的差别在统计学上有显著性意义,有时在专业上并无实用价值。如某种新的降压药,平均降低血压 2 mm
15、Hg,若样本含量较大,误差又较小,统计检验可能会得到“P0.05”的结果,但在临床上却认为此新药的疗效没有多大提高。l另外,在运用统计学中,稍有不慎都可能犯这样或那样的错误。因此,统计结论的可靠性仍需通过实践去检验。l所以,应当牢记:运用统计学时必须结合医学实际,才能真正发挥统计学应有的作用。组别N基线血压(mmHg)治疗后血压(mmHg)标准差(mmHg)P值统计学意义临床意义治疗组20016014460.05有无对照组2001601426第十三页,编辑于星期一:十二点 十分。l例:某医生用一种新的治疗某病的疗法(简称治疗组),用现在公认的疗法作为对照(简称对照组),经临床试验,对照组和治疗
16、组的疗效分别为P1=75%与P2=95。问:能认为这两个有效率之间的差别有显著性意义吗?答:这两个有效率之间的差别可能有统计学意义,也可能没有统计学意义。因为其结论不仅取决于二者之差的绝对值大小,更主要的是取决于随机误差的大小和样本大小,千万不可轻率地作出统计推断。现假定这两个有效率分别来自下列甲、乙、丙三批实验的结果,则具有下列3种不同的统计检验结果(表11)。第十四页,编辑于星期一:十二点 十分。表1、两个有效率的比较甲实验中,P1与P2之间的差别无统计学意义(校正2=1.765,P0.05)乙实验中,P1与P2之间的差别有统计学意义(26.275,0.01P0.05);丙实验中,P1与P
17、2之间的差别也有统计学意义(29.412,P0.01)。第十五页,编辑于星期一:十二点 十分。第十六页,编辑于星期一:十二点 十分。3.保证你的研究论文能通过统计学审查保证你的研究论文能通过统计学审查 据国外据国外6080年代对不同医学杂志发表论文的调年代对不同医学杂志发表论文的调查,有查,有统计错误的论文的百分比最高达统计错误的论文的百分比最高达72%,最低也有,最低也有20%。国内国内1984年对年对中华医学杂志中华医学杂志、中华内科杂中华内科杂志志、中华外科杂志中华外科杂志、中华妇产科杂志中华妇产科杂志、中华儿科杂志中华儿科杂志595篇论文的调查结果,相对数误用篇论文的调查结果,相对数误
18、用为为11.2%,抽样方法误用,抽样方法误用15.9%,统计图表误用,统计图表误用11.7%。某研究者。某研究者1996年对年对4586篇论文统计(中华医学篇论文统计(中华医学会系列杂志仅占会系列杂志仅占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。第十七页,编辑于星期一:十二点 十分。2023/3/3 JAMA,新新英英格格兰兰医医学学杂杂志志(NEJM)、英英国国医医学学杂杂志志、中中华华医医学学会会杂杂志志对对来来稿稿都都有统计学要求有统计学要求或统计学指导。或统计学指导。国国际际生生物物医医学学杂杂志志编编辑辑协协会会在在其其生生物物医医学学期期刊刊投投稿稿的的统统一
19、一要要求求中中也也包包含含了了统计学要求。统计学要求。Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:/www.acponline.org第十八页,编辑于星期一:十二点 十分。中华医学杂志中华医学杂志对来稿中统计学处理的有关要求对来稿中统计学处理的有关要求1统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计(分为前瞻性、回顾性或横断面调查分为前瞻性、回顾性或横断面调查研究研究);实验设计;实验设计(应交代具体的设计类型,如自
20、身配对设计、成组设计、交叉设计、析因设计、正交设计等应交代具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等);临床试;临床试验设计验设计(应交代属于第几期临床试验,采用了何种盲法措施等应交代属于第几期临床试验,采用了何种盲法措施等)。主要做法应围绕。主要做法应围绕4个基本原则个基本原则(随机、对随机、对照、重复、均衡照、重复、均衡)概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。2资料的表达与描述:用资料的表达与描述:用x 和和s表达近似服从正态分布的定量资料,用表达近似服从正态分布的定量资料,用M(Q)表
21、达呈偏态分布的定量资料;表达呈偏态分布的定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于2O,要注意区分百分率与百分比。要注意区分百分率与百分比。3统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备
22、的条件和分析目的,选用合适的统计分析方法,不应盲目套用的统计分析方法,不应盲目套用t检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用2 检验。对于回归分析,检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资
23、料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,实验数据的回归分析资料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、合理的解释和评价。合理的解释和评价。4统计结果的解释和表达:当统计结果的解释和表达:当P005(或或P40岁”3个组,进而按“性别、年龄分组、献血与否”3个定性因素编制统计表,见表81。性别和年龄分组进行组合,共有6种情况。然后,用t检验比较每种情况下的献血者与对照者骨矿含量均值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 科研 设计 统计学 思维
限制150内