研究生统计学讲义第1讲第2章统计学设计.ppt
《研究生统计学讲义第1讲第2章统计学设计.ppt》由会员分享,可在线阅读,更多相关《研究生统计学讲义第1讲第2章统计学设计.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 统计学设计基础统计学设计基础 一、医药研究的类型一、医药研究的类型医药科学研究常分为实验研究与调查研究两类。调查医药科学研究常分为实验研究与调查研究两类。调查研究是对某特定人群进行调查,被调查因素是客观存研究是对某特定人群进行调查,被调查因素是客观存在的,研究者只能被动进行观测,研究条件较难控制,在的,研究者只能被动进行观测,研究条件较难控制,只有通过合理分组、设置对照等手段尽量减少干扰。只有通过合理分组、设置对照等手段尽量减少干扰。实验研究是指研究者可以主动对实验对象设置处理因实验研究是指研究者可以主动对实验对象设置处理因素,受试对象被随机分配到各处理组,可以较好控制素,受试对
2、象被随机分配到各处理组,可以较好控制处理因素。实验与调查虽然在设计上有区别,但是在处理因素。实验与调查虽然在设计上有区别,但是在实际中常常结合使用。实际中常常结合使用。医药实验研究一般是先做动物实验后再移到人体,如医药实验研究一般是先做动物实验后再移到人体,如预防接种实验、药物毒力实验、某些手术方法等。实预防接种实验、药物毒力实验、某些手术方法等。实验研究中,以人为受试对象的临床实验研究特称为临验研究中,以人为受试对象的临床实验研究特称为临床试验。床试验。二、医药实验的三要素二、医药实验的三要素 处理因素、受试对象和试验效应处理因素、受试对象和试验效应 被试因素(被试因素(study fact
3、or)又称处理因素)又称处理因素(treatment factor)、试验因素。被试因素必须是试)、试验因素。被试因素必须是试验中的主因素,必须能表明进行研究的目的与意义,验中的主因素,必须能表明进行研究的目的与意义,是研究者根据研究目的所决定欲施加或欲观察的能作是研究者根据研究目的所决定欲施加或欲观察的能作用于受试对象并引起直接或间接效应的因素。用于受试对象并引起直接或间接效应的因素。被试因素的数目与水平组合的基本类型有:被试因素的数目与水平组合的基本类型有:单因单因素单水平:如夏枯草提出物对原发性高血压患者降压素单水平:如夏枯草提出物对原发性高血压患者降压作用的观察等。作用的观察等。单因素
4、多水平:如比较不同强度针单因素多水平:如比较不同强度针刺某穴位对痹证治疗效果;比较不同剂量的某药对某刺某穴位对痹证治疗效果;比较不同剂量的某药对某病的疗效。病的疗效。多因素单水平:如同多因素单水平:如同复方中不同单味复方中不同单味中药,或同一单味中药中不同有效成分的疗效观察。中药,或同一单味中药中不同有效成分的疗效观察。多因素多水平:如研究六味地黄丸诸成份和不同剂多因素多水平:如研究六味地黄丸诸成份和不同剂量对降低被切除胰腺狗血糖的影响。量对降低被切除胰腺狗血糖的影响。与与“被试因素被试因素”同时出现,也能使受试对象产同时出现,也能使受试对象产生效应的因素属于生效应的因素属于“非处理因素非处理
5、因素”或称或称“区组因素区组因素”。非处理因素虽然不是研究因素,但由于其中有些会影非处理因素虽然不是研究因素,但由于其中有些会影响实验结果,产生混杂效应,所以非处理因素又称混响实验结果,产生混杂效应,所以非处理因素又称混杂因素(杂因素(confounding factor),因为它会干扰实验结),因为它会干扰实验结果,又称干扰因素。例如,分析不同疗法对治愈某病果,又称干扰因素。例如,分析不同疗法对治愈某病所需时间,非处理因素有年龄、病程等,不同的年龄、所需时间,非处理因素有年龄、病程等,不同的年龄、病程治愈所需时间不一样,当两组病人的年龄构成或病程治愈所需时间不一样,当两组病人的年龄构成或病程
6、不同时,则影响不同疗法对治愈某病所需时间比病程不同时,则影响不同疗法对治愈某病所需时间比较的可比性。所以,在确定被试因素的同时,还要根较的可比性。所以,在确定被试因素的同时,还要根据专业知识和实验条件,找出重要的非处理因素,有据专业知识和实验条件,找出重要的非处理因素,有意识地控制或消除其干扰作用。意识地控制或消除其干扰作用。2.受试对象受试对象 受试对象(受试对象(subject)是处理因素作用的客)是处理因素作用的客体。受试对象的种类有活体动物、标本或样品、病人体。受试对象的种类有活体动物、标本或样品、病人或正常人。受试对象的基本条件是:或正常人。受试对象的基本条件是:敏感性:对被敏感性:
7、对被试因素敏感,容易显示效应。试因素敏感,容易显示效应。特异性:不易受非处特异性:不易受非处理因素干扰。理因素干扰。)稳定性:反应稳定。动物实验应选)稳定性:反应稳定。动物实验应选择敏感、特异、稳定及易于积累的动物择敏感、特异、稳定及易于积累的动物,要考虑动物的要考虑动物的生理解剖特点是否适合。如大白鼠只在喉部有气管腺生理解剖特点是否适合。如大白鼠只在喉部有气管腺,故不宜做支气管炎模型或祛痰平喘药实验。故不宜做支气管炎模型或祛痰平喘药实验。3.实实验验效效应应 实实验验效效应应(experimental effect)是是指指处处理理因因素素作作用用于于受受试试对对象象后后所所表表现现出出来来
8、的的效效果果。这这种种结结果果常常以以观观察察指指标标为为载载体体客客观观地地表表现现出出来来,有有定定量量指指标标和和定性指标。定性指标。选择效应指标要求:一共有八条选择效应指标要求:一共有八条(1)关联性:指标必须和临床试验所要回答的问题密关联性:指标必须和临床试验所要回答的问题密切相关。切相关。(2)客观性;选用客观性较强的指标,中西结合客观性;选用客观性较强的指标,中西结合(3)敏感度与特异度:敏感度与特异度(计算见第七敏感度与特异度:敏感度与特异度(计算见第七章)均等于或低于章)均等于或低于50的指标,对于临床诊断不但没的指标,对于临床诊断不但没有帮助,而且可能干扰诊断。如中药对肝炎
9、的疗效,有帮助,而且可能干扰诊断。如中药对肝炎的疗效,宜选灵敏度和特异性高的转氨酶含量等肝功化验指标;宜选灵敏度和特异性高的转氨酶含量等肝功化验指标;中药对血小板减少症的疗效宜用血小板量等指标;对中药对血小板减少症的疗效宜用血小板量等指标;对肾炎的疗效宜用肾炎的疗效宜用24小时尿蛋白总量等指标。小时尿蛋白总量等指标。(4)准确度精密度,准确度是指测定正确性的量度,)准确度精密度,准确度是指测定正确性的量度,用来反映测定值与真实值接近的程度;精密度表示各用来反映测定值与真实值接近的程度;精密度表示各次测定值集中的程度。准确度是最根本的。理想的指次测定值集中的程度。准确度是最根本的。理想的指标是既
10、准确又精密。标是既准确又精密。(5)重重现现性性:在在相相同同条条件件下下,不不管管谁谁作作重重复复试试验验都都能能得到相同的评价结果。得到相同的评价结果。(6)指标标准统一:实验设计具体实施中,从标本采)指标标准统一:实验设计具体实施中,从标本采集取样方法、部位、时间、实验方法均应统一集取样方法、部位、时间、实验方法均应统一。(7)从实际出发,尽量采用先进指标,具体见举例)从实际出发,尽量采用先进指标,具体见举例(8)严格掌握指标测试条件,避免干扰因素的影响:)严格掌握指标测试条件,避免干扰因素的影响:三、中医药研究三要素的特点三、中医药研究三要素的特点 1.1.被试因素被试因素 大体上说,
11、中医学的理(理论)、法(方大体上说,中医学的理(理论)、法(方法与原则)、方(方剂)、药(中药与草药)有大量法与原则)、方(方剂)、药(中药与草药)有大量内容需要研究,均可作为被试因素。应当注意:内容需要研究,均可作为被试因素。应当注意:(1)中医学研究中的被试因素需要具体化与物质化)中医学研究中的被试因素需要具体化与物质化(1)中医学研究中的被试因素需要具体化与物质化)中医学研究中的被试因素需要具体化与物质化 中医学是以阴阳、五行、四诊、八纲、脏腑、经络、中医学是以阴阳、五行、四诊、八纲、脏腑、经络、气血、津液学说为基础的临床医学,中医学研究的被气血、津液学说为基础的临床医学,中医学研究的被
12、试因素,需将抽象思维具体客观化。例如,将气质本试因素,需将抽象思维具体客观化。例如,将气质本质的研究列为被试因素,不但题目过大,而且不够具质的研究列为被试因素,不但题目过大,而且不够具体,难以抓住要害。如果改为脾气虚与血中胃泌素、体,难以抓住要害。如果改为脾气虚与血中胃泌素、促胰液素和胆囊收缩素关系的研究或心气虚与心促胰液素和胆囊收缩素关系的研究或心气虚与心脏收缩和舒张压能关系的探讨或肺气虚与血清血脏收缩和舒张压能关系的探讨或肺气虚与血清血管紧张素转化酶关系的观察等小题,则对气虚本质管紧张素转化酶关系的观察等小题,则对气虚本质最后阐明可能更为有利。最后阐明可能更为有利。(2)中药的研究)中药的
13、研究 中医的效果大部分体现在中药的疗中医的效果大部分体现在中药的疗效上,以中药作为被试因素,要注意七大要点效上,以中药作为被试因素,要注意七大要点 2.2.受试对象受试对象 病例选择:病例选择:既有中医病证诊断,又有现既有中医病证诊断,又有现代医学的诊断。代医学的诊断。证典型而型清楚,无夹杂和不明型,证典型而型清楚,无夹杂和不明型,应为辨证施治提供规范的依据。应为辨证施治提供规范的依据。3.3.反应指标反应指标 第二节第二节 误差知识误差知识 一、误差的分类一、误差的分类 试验所得到的观测值,不但有处理的真实效应,试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了观
14、测值与真而且还包含其它因素的影响,这就出现了观测值与真值的差异,这种差异在数值上的表现称为试验误差值的差异,这种差异在数值上的表现称为试验误差(error)。误差公理认为:试验结果都具有误差,误)。误差公理认为:试验结果都具有误差,误差自始至终存在于一切科学试验的过程之中。误差的差自始至终存在于一切科学试验的过程之中。误差的分类有多种,根据引起误差的原因和性质不同,可以分类有多种,根据引起误差的原因和性质不同,可以分为分为随机误差、系统误差和过失误差随机误差、系统误差和过失误差三类:三类:1随机误差随机误差 随机误差(随机误差(random error)又称偶然)又称偶然误差(误差(accid
15、ental error),是很多影响较小且难以完),是很多影响较小且难以完全消除的因素综合影响的结果,其误差值较小。包括全消除的因素综合影响的结果,其误差值较小。包括抽样误差和随机测量误差:抽样误差和随机测量误差:(1)抽样误差:前已叙述,抽样误差是最重要的随)抽样误差:前已叙述,抽样误差是最重要的随机误差。抽样误差是不可消除的,只有通过完善试验机误差。抽样误差是不可消除的,只有通过完善试验设计,方可使抽样误差减少。设计,方可使抽样误差减少。(2)随机测量误差:由于观测中存在着随机测量变)随机测量误差:由于观测中存在着随机测量变异,同一个体多次观测的结果有差异,这种差异称为异,同一个体多次观测
16、的结果有差异,这种差异称为随机测量误差。随机测量误差也是不可避免的,但改随机测量误差。随机测量误差也是不可避免的,但改善测量手段和测量条件善测量手段和测量条件可以将随机测量误差控制在很可以将随机测量误差控制在很小的范围内。小的范围内。测测量量值值xi与与真真值值x之之间间偏偏差差的的绝绝对对值值,称称为为测测量量值值xi的的绝绝对对误误差差,记记为为xi,xixxi。绝绝对对误差与测量值比值的绝对值误差与测量值比值的绝对值 xi/xi 称为相对误差。称为相对误差。因因为为真真值值x未未知知,所所以以,不不知知道道绝绝对对误误差差xi和和相相对对误误差差xi/xi的的准准确确值值,只只能能估估计
17、计其其不不超超过过某某个个数数量量界界限限值值,这这种种界界值值称称为为最最大大绝绝对对误误差差和和最最大大相相对对误误差差。实实际际工工作作中中,绝绝对对误误差差和和相相对对误误差差都都是是指指最最大大绝绝对对误误差差和最小绝对误差。和最小绝对误差。因为有效数字末位之前的数字是可靠数字,末位是按因为有效数字末位之前的数字是可靠数字,末位是按“4舍舍6入入5凑偶凑偶”进行取舍的可疑数字,所以,只允许进行取舍的可疑数字,所以,只允许末位数有末位数有0.5个单位(个单位(0.5)的误差。例如有四位有效数)的误差。例如有四位有效数字的观测值字的观测值1.234g,最大绝对误差为,最大绝对误差为0.0
18、005g,最大相对,最大相对误差等于误差等于 0.0005/1.234 0.0405%。随随机机测测量量误误差差与与抽抽样样误误差差的的性性质质:双双向向的的,可可正正可可负;负;其产生不可避免。其产生不可避免。随机误差(主要指抽样误差)的思想贯穿科研统计的随机误差(主要指抽样误差)的思想贯穿科研统计的始终。始终。2系统误差系统误差 (systematic error)是由某种固定原因)是由某种固定原因所造成的误差,使测定结果系统偏高或偏低。当重复所造成的误差,使测定结果系统偏高或偏低。当重复测量时重复出现,有规律性,大小正负是可测定且可测量时重复出现,有规律性,大小正负是可测定且可校正校正,
19、故又称可测误差。在临床试验中,由于非试验因故又称可测误差。在临床试验中,由于非试验因素干扰所形成的系统误差歪曲了被试因素真实效果,素干扰所形成的系统误差歪曲了被试因素真实效果,常称为常称为偏倚偏倚(bias)。)。产生产生系统误差的原因主要有:系统误差的原因主要有:方法误差;方法误差;仪仪器和试剂误差;器和试剂误差;条件误差条件误差;顺序误差顺序误差 ;分分配误差配误差 ;主观误差:主观误差:系统误差可归纳为两个重要特性:系统误差可归纳为两个重要特性:单向性:这种误单向性:这种误差可重复测定,偏差的方向一致(偏高或偏低),并差可重复测定,偏差的方向一致(偏高或偏低),并且这种误差常呈恒差或等比
20、形式出现。且这种误差常呈恒差或等比形式出现。可消除性:可消除性:只要找出原因,通过合理设计或控制原因,系统误差只要找出原因,通过合理设计或控制原因,系统误差可以基本消除或减至最小程度。可以基本消除或减至最小程度。3过失误差过失误差 (gross error)随机误差影响试验的精确性。系统误差和过失误差随机误差影响试验的精确性。系统误差和过失误差差影响试验的准确性,为了提高试验的准确性与精确差影响试验的准确性,为了提高试验的准确性与精确性,即提高试验的正确性,必须避免系统误差和过失性,即提高试验的正确性,必须避免系统误差和过失误差,降低随机误差。误差,降低随机误差。医药中有些数值是由多种实测值计
21、算的,如动物用医药中有些数值是由多种实测值计算的,如动物用药剂量的计算,会受药物称重、药液量、注射量、动药剂量的计算,会受药物称重、药液量、注射量、动物体重四个实测值的影响:物体重四个实测值的影响:用药剂量用药剂量 由由于于原原始始测测量量值值总总是是存存在在误误差差的的,所所以以运运算算的的结结果果值值也也必必然然存存在在误误差差,这这种种特特点点称称为为“误误差差传传递递”。误误差传递的法则主要有以下几点:差传递的法则主要有以下几点:(1)加减运算时,取实测值中小数位数最小的位数。)加减运算时,取实测值中小数位数最小的位数。例如:例如:5.4321+543.21(kg)得)得548.642
22、1(kg),应写),应写为为548.65(kg),最大绝对误差为),最大绝对误差为0.005kg。(2)乘除运算时,取实测值中有效数字最小的位数。)乘除运算时,取实测值中有效数字最小的位数。例如,例如,20g小鼠用药小鼠用药100.0mg,其剂量是,其剂量是5000mg/kg,应写为应写为5.0g/kg。最大绝对误差为。最大绝对误差为0.05g/kg。【例例2.1】药药物物称称重重600.0mg,药药液液取取量量50.00mL,注注射射容容量量0.86mL,动动物物体体重重0.0234kg,按按误误差差传传递递规规律律计算用药剂量:计算用药剂量:用药剂量用药剂量=(600.0/50.00)(0
23、.86/0.0234)4.4102(mg/kg)0.44(g/kg)这里,这里,4.4102mg/kg是采用科学记数法表示保留是采用科学记数法表示保留2位有位有效数字,而不能写为效数字,而不能写为440mg/kg(表示保留(表示保留3位有效数字)位有效数字)。(3)对对数数运运算算时时,对对数数尾尾数数的的有有效效数数字字与与实实测测值值相相同同。如如;lg125是是2.09691,应应写写为为2.097(尾尾数数有有3位位有有效数字)。效数字)。(4)均数及标准差,标准差一般取)均数及标准差,标准差一般取 2 或或 3 位有效数位有效数字,均数按标淮差的小数位数取值。如字,均数按标淮差的小数
24、位数取值。如 2.17550.1552应取应取2.180.16(kg)。)。常数(如常数(如,e)及分类变量值(如有效例数,实验次)及分类变量值(如有效例数,实验次数)的误差为数)的误差为0,有效数字位数可任意选取。,有效数字位数可任意选取。第三节第三节 实验设计的基本原则实验设计的基本原则 实验设计(实验设计(experimental design)是依据研究目的,按)是依据研究目的,按统计学要求而制定的研究计划的具体实施方案,包括统计学要求而制定的研究计划的具体实施方案,包括所进行研究的三要素,估计样本含量,确定随机分配、所进行研究的三要素,估计样本含量,确定随机分配、统计分析方法等所要采
25、取的技术路线和方法,使能用统计分析方法等所要采取的技术路线和方法,使能用较为经济的人力、物力、财力及时间进行研究,最大较为经济的人力、物力、财力及时间进行研究,最大限度地减少误差,保证研究结果的可靠性与可重复性。限度地减少误差,保证研究结果的可靠性与可重复性。实验设计是研究过程的依据,统计数据处理的前提,实验设计是研究过程的依据,统计数据处理的前提,是提高科研成果质量的一个重要保证。根据误差产生是提高科研成果质量的一个重要保证。根据误差产生的来源,实验设计必须遵守三个基本原则,的来源,实验设计必须遵守三个基本原则,即对照原即对照原则、随机化分组原则、重复原则。则、随机化分组原则、重复原则。(一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 统计学 讲义 设计
限制150内