《常用实验设计方法.ppt》由会员分享,可在线阅读,更多相关《常用实验设计方法.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用的实验设计方法常用的实验设计方法第二军医大学第二军医大学 卫生统计学教研室卫生统计学教研室孟孟 虹虹一种研究要最有效的实行,需一种研究要最有效的实行,需要科学的设计方法,使得收集的数要科学的设计方法,使得收集的数据适宜统计学方法的分析,得出客据适宜统计学方法的分析,得出客观和有效的结论。观和有效的结论。任何研究都存在两个问题:设任何研究都存在两个问题:设计方法和统计分析,二者是紧密相计方法和统计分析,二者是紧密相连的,分析的方法依赖所用的设计。连的,分析的方法依赖所用的设计。科研设计的步骤和内容科研设计的步骤和内容1.提出研究问题和假设提出研究问题和假设2.选择研究对象、确定研究因素和对照
2、组。选择研究对象、确定研究因素和对照组。3.确定测量指标与标准化和量化确定测量指标与标准化和量化4.选择恰当的统计设计方法选择恰当的统计设计方法*5.科学估计样本含量科学估计样本含量*6.随机化分组和抽样随机化分组和抽样7.避免机遇、偏倚造成的误差,确保结果的避免机遇、偏倚造成的误差,确保结果的真实可靠、正确。真实可靠、正确。*8.采用正确的统计方法分析资料。采用正确的统计方法分析资料。实验(试验)设计方法概述实验(试验)设计方法概述实验(试验)设计包括专业和统计学设计。实验(试验)设计包括专业和统计学设计。专业设计考虑:专业设计考虑:确确定定研研究究的的被被试试因因素素个个数数与与水水平平数
3、数,受受试试对象、效应指标,可控的非处理因素等。对象、效应指标,可控的非处理因素等。.统计设计方法选择:统计设计方法选择:1.根据研究对象、可行性和结果要求精度。根据研究对象、可行性和结果要求精度。2.依据要说明因素数量。依据要说明因素数量。干预(试验、实验)研究干预(试验、实验)研究设计中的三设计中的三个个基本要素:基本要素:1.实验因素实验因素:是人为施加于研究对象,需研:是人为施加于研究对象,需研究的因素。一般是单因素研究。但可以设置究的因素。一般是单因素研究。但可以设置多因素研究。多因素研究。2.受试对象受试对象:为人、动物、标本。:为人、动物、标本。对象在来源、条件大致一致。对象在来
4、源、条件大致一致。3.试验效应试验效应:反映处理因素变化的指标。:反映处理因素变化的指标。有主要效应指标(有关联性、客观性)和次有主要效应指标(有关联性、客观性)和次要指标。要指标。实验因素实验因素单因素实验:单因素实验:指实验中研究对象被干预的指实验中研究对象被干预的因素只有一个,因素包括因素只有一个,因素包括g g(g2g2)个水平,个水平,目的:分析不同水平实验结果是否有差别。目的:分析不同水平实验结果是否有差别。多因素实验:多因素实验:指实验中研究对象被干预的指实验中研究对象被干预的因素不只一个,各因素的水平为因素不只一个,各因素的水平为22,分析,分析某因素不同水平的结果有无差别,分
5、析多某因素不同水平的结果有无差别,分析多因素对实验结果有无交互作用。因素对实验结果有无交互作用。例4-2:表4-3 研究一种降血脂新药的临研究一种降血脂新药的临床疗效床疗效研究对象:高血脂病人研究对象:高血脂病人处理因素:降血脂药处理因素:降血脂药因素水平因素水平:服降血脂新药分为:服降血脂新药分为2.4g组组,4.8g组,组,7.2g组,组,安慰剂组安慰剂组试验效应指标试验效应指标:低密度脂蛋白:低密度脂蛋白特点:每个研究对象只接受该处理的一个水平。特点:每个研究对象只接受该处理的一个水平。两两因素设计因素设计例:研究蛋白含量因素(例:研究蛋白含量因素(A),),分为正常(分为正常(a1)和
6、缺乏(和缺乏(a2)组,脂肪含量因素(组,脂肪含量因素(B),),分为正分为正常(常(b1)缺乏(缺乏(b2)组,对大鼠的营养状况研究。组,对大鼠的营养状况研究。16只大鼠按完全随机化方法分到以下只大鼠按完全随机化方法分到以下4组做试验。组做试验。4种处理组某营养指标结果种处理组某营养指标结果a1b1a1b2a2b1a2b215182025212328372528193532352640一、常用实验(试验)设计一、常用实验(试验)设计实验的定义是:实验的定义是:对研究变量(对研究变量(x x)做有目的改变,做有目的改变,使他能看到和识别引起反应变量使他能看到和识别引起反应变量(y y)的变化。
7、的变化。实验研究的目的实验研究的目的1.确确定定那那些些实实验验因因素素变变量量(x)对对效效应指标(应指标(y)是有影响的是有影响的2.确定有影响的确定有影响的x设置在什么水平上设置在什么水平上可使可使y接近所希望的值。接近所希望的值。实验设计的原理实验设计的原理分组分组实验效应实验效应实验组(实验组(T+S1)(E+S1)对照组(对照组(C+S2)(0+S2)实验设计理论上组间随机误差实验设计理论上组间随机误差S1=S2,两两组组结结果果:(E+S1)(S2)=差差(E)即即实实验效应。验效应。设计的基本原则:对照、随机、重复、均衡设计的基本原则:对照、随机、重复、均衡实验实验对象对象处理
8、因素处理因素随机随机分组分组常用的实验(试验)统计设计方法:常用的实验(试验)统计设计方法:单因素实验设计方法:单因素实验设计方法:使用使用研究对象研究对象1.完全随机分组完全随机分组多多难控制难控制2.随机配对或区组设计随机配对或区组设计较多较多容易控制容易控制3.拉丁方设计拉丁方设计少少容易控制容易控制多个因素实验设计方法:多个因素实验设计方法:使用使用研究因素研究因素1.析因设计析因设计多多多结果多结果2.正交设计正交设计 较多较多多结果多结果3.重复测量设计重复测量设计较多较多4.交叉设计交叉设计少少(一)单因素比较的设计方法(一)单因素比较的设计方法1.完完全全随随机机分分组组设设计
9、计(completelyrandomdesign)定定义义:受受试试对对象象完完全全按按随随机机原原则则分分配配到到试试验验组组和和对对照照组组,对对他他们们的的效效应应进进行行平平行行观观察察,最最后后对对结结果果进进行行成成组组比比较的统计分析较的统计分析。统统计计分分析析方方法法:两两组组或或多多组组的的t检检验验或方差分析、或方差分析、2等。等。完全随机分组同期研究的设计模式完全随机分组同期研究的设计模式 研究对象研究对象纳入符合标准的研究对象纳入符合标准的研究对象随机化分组随机化分组试验组试验组对照组对照组有效有效无效无效有效有效无效无效试验措施对照措施优缺点:优缺点:设计简单,适应
10、面广,可分两组设计简单,适应面广,可分两组或多组,组间例数可等或不等。在或多组,组间例数可等或不等。在例数较少时(临床研究)采用该设例数较少时(临床研究)采用该设计,组间的均衡性较低。因此采用计,组间的均衡性较低。因此采用该设计该设计实验样本例数较多实验样本例数较多。2.配对配对设计设计配对的含义:配对的含义:指将研究对象按某些特征配成对子的设指将研究对象按某些特征配成对子的设计方法。计方法。包括有:包括有:同同体体配配对对:用用处处理理前前后后的的比比较较或或同同个个体体两两个器官给予不同处理比较。个器官给予不同处理比较。异体配对异体配对:不同个体组成对子,每对子中:不同个体组成对子,每对子
11、中之一随机给予不同水平的处理。之一随机给予不同水平的处理。配对设计配对设计应用范围:应用范围:1.自自身身试试验验前前后后配配对对了了解解单单个个处处理理的的效效果果,多多用用于于急急性性和和短短期期试试验验,临临床床研研究究观观察察短短期治疗效果。期治疗效果。2.同体左右的配对同体左右的配对 多用于局部用药研究、多用于局部用药研究、两种检验方法对同标本的对比。两种检验方法对同标本的对比。3.异体配对:主要为平行研究两处理的比异体配对:主要为平行研究两处理的比较,满足条件都可用此方法。较,满足条件都可用此方法。3.随机区组设计随机区组设计区组也称为单位组(区组也称为单位组(block)或配伍组
12、,是或配伍组,是配对设计的扩展。配对设计的扩展。设计方法:设计方法:1)研究对象按规定条件进行配伍(区组)研究对象按规定条件进行配伍(区组)2)区组内的对象数)区组内的对象数=处理组数处理组数3)在区组内随机化分组,分配各处理。)在区组内随机化分组,分配各处理。(规定条件是指希望控制的非处理因素)(规定条件是指希望控制的非处理因素)随机区组设计实例随机区组设计实例观察三个染尘时期对肺湿重的结果,观察三个染尘时期对肺湿重的结果,15只大鼠只大鼠采用随机区组设计。采用随机区组设计。1.将体重相似大鼠组成将体重相似大鼠组成5个区组。区组内对象个区组。区组内对象=3。2.区组内随机化分组如下:区组内随
13、机化分组如下:区组号区组号12345对象编号对象编号123123123123123随机数随机数122056901728342316704680.序号序号321132321213.规定:序号为规定:序号为1分到甲组,分到甲组,2为乙组,为乙组,3为丙组。为丙组。用用二氧化硅二氧化硅50mg对对15只大鼠染尘不同只大鼠染尘不同时期后全肺湿重的结果时期后全肺湿重的结果区组号区组号染尘染尘1月月3月月6月月13.34.43.623.64.44.634.33.65.144.14.55.054.24.75.5配对和区组设计优缺点配对和区组设计优缺点 1.配对(区组)控制非处理因素对结配对(区组)控制非处理
14、因素对结果影响,各处理组间均衡性较好。减少果影响,各处理组间均衡性较好。减少实验误差实验误差.2.样本例数少于完全随机分组例数。样本例数少于完全随机分组例数。3.统计检验效率高。统计检验效率高。局限:局限:临床研究和人群研究满足一定数量异临床研究和人群研究满足一定数量异体配对条件的对象较困难。体配对条件的对象较困难。配对设计数据配对设计数据不同饲料大鼠肝中维生素不同饲料大鼠肝中维生素A含量含量编号编号正常饲料正常饲料缺乏维生素缺乏维生素E1.1.070.7420.600.7230.900.5441.190.9651.140.9861.130.8171.040.7580.920.53均数均数0.
15、99880.7538差值差值=0.2450配对差值配对差值t=4.208,SE=0.0582两两均数均数t=2.735,SE=0.08961.配对比较样本例数是两组比较的配对比较样本例数是两组比较的1/2两两样本均数比较样本均数比较的例数估计公式的例数估计公式配对比较例配对比较例数估计公式数估计公式2.配对和区组比较的实验误差小于完全配对和区组比较的实验误差小于完全随机分组随机分组.多多因素试验设计问题因素试验设计问题例;例;研究不同负荷(研究不同负荷(A因素因素)和不同航空装和不同航空装置(置(B因素)对呼吸阻力,因素)对呼吸阻力,A因素有三个水平,因素有三个水平,在自行车功量计上静坐、在自
16、行车功量计上静坐、250与与600kg/min的的体力负荷,体力负荷,B因素有两个水平,即因素有两个水平,即YX-1与与YX-3供氧系统。供氧系统。1.如如12受试者,每人接受一种试验,应如受试者,每人接受一种试验,应如何安排?何安排?2.如每人在一定时间内可重复接受所有试如每人在一定时间内可重复接受所有试验,如何安排试验?验,如何安排试验?1.析因设计简介析因设计简介(Factorialdesign)析因设计是研究两个或多个因素的效应及因析因设计是研究两个或多个因素的效应及因素间交互作用的实验设计方法。素间交互作用的实验设计方法。特点:析因设计是各因素和各水平的全面组合特点:析因设计是各因素
17、和各水平的全面组合试验。试验。表示方法;表示方法;第第1因素的水平数因素的水平数第第2因素的水平数因素的水平数.,如如22,33,223或或23=水平数水平数因素数因素数=222例:研究蛋白含量因素(例:研究蛋白含量因素(A),),分为正常(分为正常(a1)、)、缺乏(缺乏(a2),),脂肪含量因素(脂肪含量因素(B),),分为正常分为正常(b1)、)、缺乏(缺乏(b2),),对大鼠的营养状况研究。对大鼠的营养状况研究。16只大鼠按完全随机化方法分到以下只大鼠按完全随机化方法分到以下4组做试验。组做试验。4种处理组某营养指标结果种处理组某营养指标结果a1b1a1b2a2b1a2b2151820
18、25212328372528193532352640用途和优缺点用途和优缺点用途:可比较各种组合,筛选最佳测定值方案。用途:可比较各种组合,筛选最佳测定值方案。优点:优点:1.可分析单因素的效应,也可分析因素之间的可分析单因素的效应,也可分析因素之间的交互效应交互效应2.比比单单因素节省试验次数,统计效率高。因素节省试验次数,统计效率高。缺点:如果因素和水平过多,则造成处理组数缺点:如果因素和水平过多,则造成处理组数很多和样本例数多。很多和样本例数多。实验样本例数实验样本例数=实验组合数实验组合数实验重复例数实验重复例数例:研究电流和温度对某物质结果(例:研究电流和温度对某物质结果(y)的影响
19、的影响因素:因素:1.温度温度=25,502.电流电流=1K,3K单因素设计:固定电流单因素设计:固定电流=1K,了解温度对结果了解温度对结果y值的影响值的影响 2550 温度240230210205Y单单因素研究每个因素研究每个水平最少重复两水平最少重复两次。次。D1=240-210=30D2=230-205=25采用22析因设计,25501K3K210180240200 温度温度电电流流变化变化30变动变动2025,1k25,3k50,1k50,3k温度效应温度效应固定因素固定因素温度的变化温度的变化平均变化平均变化1Ky=240-210=30253Ky=200-180=20电流变化电流变
20、化25度度y=180-210=-30-3550度度y=200-240=-40析因设计用析因设计用4次试验代替单因素次试验代替单因素8次试验,次试验,得出两因素变化的效应。得出两因素变化的效应。22析因实验设计方法析因实验设计方法1)将将22析因组合成析因组合成4个处理组个处理组2)根据实验对象(动物、标本、人)选)根据实验对象(动物、标本、人)选择分配处理随机化方法择分配处理随机化方法采用随机化方法:采用随机化方法:1.完全随机化分组完全随机化分组2.随机区组随机区组3)每组例数至少)每组例数至少2例例4)每组例数要相等)每组例数要相等22析因设计实例析因设计实例例:比较两种神经缝合方法(例:
21、比较两种神经缝合方法(A)和时间(和时间(B)对神经损伤轴突通过率的情况。对神经损伤轴突通过率的情况。缝合方法;外膜缝合(缝合方法;外膜缝合(A1),),束膜缝合(束膜缝合(A2)缝合时间(缝合时间(B):):1月(月(B1),),2月(月(B2)用用20只家兔用采用完全随机分组方法分为只家兔用采用完全随机分组方法分为4组,组,分别给予分别给予4种处理,结果见表种处理,结果见表12-3表表11-1家兔神经缝合后轴突通过率家兔神经缝合后轴突通过率(%)外膜缝合外膜缝合(A1)束膜缝合束膜缝合(A2)1月月2月月1月月2月月(a1b1)(a1b2)(a2b1)(a2b2)1030105010302
22、050407030705060506010303030 24 44 28 52 120 220 140 260 740 4400 11200 4800 14400 34800表表12-4资料析因试验方差分析表资料析因试验方差分析表变异来源变异来源SSdfMSFP处理组间处理组间26203主效应主效应A18011800.60.05B2420124208.070.05误差误差480016300总总7420192、正交设计与方差分析、正交设计与方差分析1)基本概念:)基本概念:析因设计:析因设计:G个处理组的全面组合试验个处理组的全面组合试验设计。例:设计。例:25=32个处理组。在因素组个处理组。
23、在因素组合多时常采用正交设计。合多时常采用正交设计。正交设计:是多因素非全面组合的实验正交设计:是多因素非全面组合的实验设计。是析因设计的部分组合(如设计。是析因设计的部分组合(如1/2G、1/3G)设计。设计。用途和优点用途:用途:主要用于标本、动物试验,寻主要用于标本、动物试验,寻找影响因素和筛选最佳实验方案。找影响因素和筛选最佳实验方案。优点优点:在不减少效率基础上,可成倍:在不减少效率基础上,可成倍减少试验次数。特别适用多因素减少试验次数。特别适用多因素(3个个及以上)的实验设计。及以上)的实验设计。假定假定:各因素无交互或只有一阶交互:各因素无交互或只有一阶交互作用。作用。2)正交实
24、验设计方法)正交实验设计方法(借助正交表(借助正交表)实验按正交表的表头和表体安排处理组实验按正交表的表头和表体安排处理组表头用表头用表示表示其中其中L:表示正交表表示正交表N:试验次数(最多的处理组数)试验次数(最多的处理组数)m:表示因素的水平数表示因素的水平数K:表示最多安排的因素表示最多安排的因素例:例:正交设计表头因素 实施 列号个数 比例 1 2 3 4 5 6 73 1 A B AB C AC BC ABC4 1/2 A B AB C AC BC D CD BD AD正交表体处理组处理组列号列号列号列号123456711111111211122223122112241222211
25、52121212621221217221121182212112注:1=某因素低水平,2=高水平例:研究饲料中添加不同物质对例:研究饲料中添加不同物质对大鼠大鼠血清胆固醇(血清胆固醇(y)的影响的影响因素和水平因素和水平因素 水平 1 水平2A胆酸 不用胆酸 0.3%胆酸B胆固醇 不用胆固醇 0.1%胆固醇C猪油 不加猪油 10%猪油D性别 雌 雄大鼠血清胆固醇正交设计及实验结果大鼠血清胆固醇正交设计及实验结果处理组处理组ABCDABACBC结果结果)列号列号12473561111111133021122122340312122124034122122158152112221400621212
26、124307221112251682222111558水平水平11657150316491857174717211869水平水平2190420581912170418141840169221247555262-15367119-177统计学方法方差分析变异来源变异来源SSDFMSFpA胆酸胆酸25421254229.70.001B胆固醇胆固醇12834112834149.90.001C猪油猪油288211283433.60.001D性别性别975197511.30.004AB18711872.10.159AC59015906.80.018BD13051130515.20.001误差误差1369
27、.31685.53用用各处理各处理3次测定值的均数计算方差分析次测定值的均数计算方差分析某人对研究某人对研究4个因素对某产物的影响,希望个因素对某产物的影响,希望找出最佳水平。找出最佳水平。实验方法;实验方法;1.培养基含水量(培养基含水量(%)水平:水平:304050607080得出含水量在得出含水量在55-65较好。较好。2、培养基的、培养基的PH值,值,得出得出PH值在值在6.5-7.5较好。较好。3.温度:温度:202528303235得出培养温度在得出培养温度在28较好。较好。4、光线:强光、光线:强光避光避光得出:避光较好。得出:避光较好。最后得出的最佳水平:含水量在最后得出的最佳
28、水平:含水量在55-65较好,较好,PH值值在在6.5-7.5较好,温度在较好,温度在28较好,避光较好。较好,避光较好。评述:本实验将4个因素在单因素状态得出的最佳水平,如放在一起做实验,结果会发生变化,因素之间一般会存在一定程度的交互作用。因此,结论不一定正确。设计:可考虑用正交设计。3.重复测量试验设计与方差分析重复测量试验设计与方差分析(Repeatedmeasuresdesigns)析因设计的特例析因设计的特例重复测量数据的定义重复测量数据的定义指试验对象在给定处理后,对同一指试验对象在给定处理后,对同一对象的观察指标在不同时点的测量。对象的观察指标在不同时点的测量。观察值间是有相关
29、的观察值间是有相关的。例:表12-6 两种药物治疗前后舒张压结果患者 扶正胶囊 患者 可乐定编号0 1 2 3天 编号 0 1 2 3天 1 10 9 8.6 8.8 11 10 6.2 6.3 6.5 2 9 9 8.5 8.0 12 10 7.0 6.0 6.010 9.0 8.0 7.3 7.5 20 8.0 6.0 6.0 6.0Xi 93 81 75 75 92 66 64 64本例问:那种药物降血压更缓些?本例问:那种药物降血压更缓些?重复测量疗效比较的设计回答:1.不同的药物(两组或多组)效果是否不同?不同的药物(两组或多组)效果是否不同?2.不同时间点效果是否不同?不同时间点效
30、果是否不同?3.时间和处理时间和处理(药物药物)间有无交互作用间有无交互作用设计要求:设计要求:N个对象随机分为个对象随机分为G 2组,给予不同处理。组,给予不同处理。各组各组(n1,n2)例数可不等。例数可不等。2.所有对象观察时间点要相同(时间点所有对象观察时间点要相同(时间点2)。3.基线的测定值通常要有。基线的测定值通常要有。重复测量疗效对比试验设计模式设计模式:设计模式:某指标不同时间测定值某指标不同时间测定值标准药标准药A组组0246(周)(周)N对象对象Baseline随机随机B组组0246(周)(周)新药新药n2n1重复测量数据统计分析方法重复测量数据统计分析方法统计方法:统计
31、方法:重复测量数据的方差分析重复测量数据的方差分析重复测量数据采用下列方法不正确重复测量数据采用下列方法不正确析因设计方差分析析因设计方差分析完全随机分组方差分析完全随机分组方差分析随机区组方差分析随机区组方差分析例:两种药物治疗前后结果的方差分析(表12-27)变异来源变异来源MSDFF值值P值值处理间(药物)处理间(药物)19.0613122.070.0002测量时间测量时间23.6635355.790.0001处理处理 测量时间测量时间1.821834.300.0086研究对象的误差研究对象的误差0.863618重复测量误差重复测量误差0.423654重复测量数据统计分析重复测量数据统计
32、分析的误用情况的误用情况1.重复测量数据疗效的比较不设平行对照组。重复测量数据疗效的比较不设平行对照组。2.有对照组有对照组,但采用其他统计分析方法(如但采用其他统计分析方法(如t检验、检验、随机区组或析因的方差分析计算。随机区组或析因的方差分析计算。结果:结果:1)将增大犯一型误差的概率。)将增大犯一型误差的概率。2)忽略时间点变化的特征。)忽略时间点变化的特征。例:某处理因素对某指标在不例:某处理因素对某指标在不同时间的效果比较同时间的效果比较比较组比较组np试验前试验前205.521周后周后208.230.052周后周后2010.82.20.0014周后周后2012.63.10.001指
33、标的变化是处理的作用或是时间变指标的变化是处理的作用或是时间变化的作用化的作用?二、科学的选择样本例数二、科学的选择样本例数实验研究中的一个问题:实验研究中的一个问题:我的这项研究我的这项研究应需要多少样本例数?应需要多少样本例数?统计上问你:统计上问你:你希望你希望多大的差别能被查出?多大的差别能被查出?能容忍多大的错误结论风险?能容忍多大的错误结论风险?你研究的指标变异有多大?你研究的指标变异有多大?影响样本例数大小的因素影响样本例数大小的因素1)资料性质:计量数据可少于计数资料。)资料性质:计量数据可少于计数资料。2)实验效应;处理作用有多强,或比较)实验效应;处理作用有多强,或比较组的
34、差别。处理作用大,例数越小。组的差别。处理作用大,例数越小。3)误差大小:个体变异越小,例数越小。)误差大小:个体变异越小,例数越小。样本例数估计方法样本例数估计方法1)公式计算法)公式计算法2)查表法(略)查表法(略)3)估计法:根据以往经验估计。)估计法:根据以往经验估计。大动物大动物5-15只只中等动物(兔)中等动物(兔)10-20只只小动物(小鼠)小动物(小鼠)15-30只只人各组至少人各组至少30以上。以上。公式法估计样本含量的参数公式法估计样本含量的参数研究者必须事先确定几个参数研究者必须事先确定几个参数.1.犯犯误差的概率,即误差的概率,即?=0.052.检检验验效效能能=1-有
35、有多多大大?常常定定为为0.1或或0.2,检检验效能验效能=1-,不低于,不低于0.753.两种处理间最小有意义的差值(两种处理间最小有意义的差值()两均数之差两均数之差两率之差两率之差4.研究指标的标准差或发生率有多大?研究指标的标准差或发生率有多大?统计检验效能(统计检验效能(power)的概念的概念本身两总体参数有差别,在一定的本身两总体参数有差别,在一定的样本例数下,统计检验的方法又能样本例数下,统计检验的方法又能查出二者有差别的能力(概率),查出二者有差别的能力(概率),为检验效能为检验效能=1-。例:例:=0.2,检验效能检验效能=1-0.2=0.81)两样本均数比较两样本均数比较
36、样本例数估计公式法(样本例数估计公式法(n1或或n2为每组为每组需要的例数)需要的例数)对照与实验组比较对照与实验组比较最小有意义的差值最小有意义的差值:该指标的变异,可用样本的该指标的变异,可用样本的S作为估计值作为估计值例:饮食中降低盐的摄取能否降例:饮食中降低盐的摄取能否降低血压的研究低血压的研究1.设计:不配对的两组比较,将受试者分设计:不配对的两组比较,将受试者分为低盐饮食组和高盐饮食组,预试调查时为低盐饮食组和高盐饮食组,预试调查时发现两组的血压标准差分别为发现两组的血压标准差分别为12.和和10.3(mmHg)。)。如如=0.05,=0.10,希望两组比较有意义希望两组比较有意义
37、的最小平均差值的最小平均差值=5(mmHg),),问正式问正式研究各组需要多少例数?研究各组需要多少例数?式中的式中的查查t分布中的分布中的v=的值,的值,本例方差(本例方差(2)用样本的估计用样本的估计双侧单侧样本例数估计样本例数估计样本例数的估计含义样本例数的估计含义本例各组至少调查本例各组至少调查86例,有例,有90%的可能性的可能性查出两组的最小差别,即相差查出两组的最小差别,即相差5(mmHg)。)。例:例:某医院用新药和常规药治疗婴幼儿贫某医院用新药和常规药治疗婴幼儿贫血,血,20名贫血患儿随机分成两组,测得血名贫血患儿随机分成两组,测得血红蛋白增加量如下,问两组疗效有无差别红蛋白
38、增加量如下,问两组疗效有无差别?新药组n=10 常规组n=10 经统计检验经统计检验问题:此结果是假阴性或是新药不比常规药更优问题:此结果是假阴性或是新药不比常规药更优?问:问:1.本例各组例数为本例各组例数为10时,检验效能多时,检验效能多大?大?2.如本例两组血红蛋白平均增加如本例两组血红蛋白平均增加2.7单单位为有临床意义,各组应多少病人时位为有临床意义,各组应多少病人时差别才统计意义?差别才统计意义?SAS软件计算Group1Mean=23.6Group2Mean=20.9Group1Mean=23.6Group2Mean=20.9=2.7=2.7StandardDeviation=5
39、Alpha=0.052-StandardDeviation=5Alpha=0.052-SidedTestSidedTest N检验效能检验效能检验效能检验效能NtNt值值100.2080.700440.700442.132.13200.3830.800200.3830.800552.39552.39300.5380.900300.5380.900742.77742.7740400.6640.664两两样本样本t检验检验2)两样本率比较的样本含量)两样本率比较的样本含量公式:P1和p2为各组率的估计值例:观察两药对某病的疗效。初步试验甲药例:观察两药对某病的疗效。初步试验甲药有效率为有效率为60
40、%,乙药为,乙药为85%,如如=0.05,=0.1,正式试验每组最少观察多少例?正式试验每组最少观察多少例?如如=0.2,单侧如两率相差15%,=0.05,=0.1,各组需要各组需要n=159三、实验(试验)中误差及控制三、实验(试验)中误差及控制观察(实验)数据(观察(实验)数据(x)=+e真值真值误差误差误差(误差(error)按产生分类:按产生分类:数据的误差数据的误差=随机误差随机误差+系统误差系统误差1.随机误差:由个体变异(个体因素)和未随机误差:由个体变异(个体因素)和未知因素的、微小不可控因素造成。知因素的、微小不可控因素造成。2.系统误差:可知或可控制因素造成。系统误差:可知
41、或可控制因素造成。例如:仪器、测量方法、例如:仪器、测量方法、研究对象的研究对象的选择选择、医生测量结果的标准不统一医生测量结果的标准不统一,造成测定值与真值的偏差。造成测定值与真值的偏差。3.抽样误差:组间的变异与真值(总抽样误差:组间的变异与真值(总体指标)误差。体指标)误差。试验中误差的控制和缩小试验中误差的控制和缩小一、在设计阶段一、在设计阶段1.限制研究对象入选条件限制研究对象入选条件(实验和观察研究)实验和观察研究)2.配对和配伍的实验设计配对和配伍的实验设计3.随机化和有一定例数随机化和有一定例数4.盲法盲法二、在资料分析阶段二、在资料分析阶段分层和多因素统计方法控制混杂因素。分
42、层和多因素统计方法控制混杂因素。二在在分析阶段混杂因素、变异控制方法分析阶段混杂因素、变异控制方法采用统计学方法采用统计学方法1.单个因素控制:用分层、协方差分析方单个因素控制:用分层、协方差分析方法。法。2.多个因素控制;多因素统计方法。多个因素控制;多因素统计方法。1)结果变量为计量资料:多元线性回归。)结果变量为计量资料:多元线性回归。2)结果变量为分类资料:)结果变量为分类资料:Logistic回归。回归。表表13-6三组大鼠进食量(三组大鼠进食量(x)与与增重(增重(y)大鼠大鼠A饲料饲料B饲料饲料C饲料饲料编号编号X1Y1X2Y2X3Y31256.927.0260.332.0544
43、.7160.32271.641.7271.147.1481.296.18均数均数272.337.1274.645.7492.4118.7协方差分析协方差分析例:某人探讨肝胆病人术后感染与危险因素的关系,例:某人探讨肝胆病人术后感染与危险因素的关系,作者记录了病人的年龄、手术时间、术后引流时间等作者记录了病人的年龄、手术时间、术后引流时间等6个因素,分别用个因素,分别用6个个22分类表,计算各因素与感染的分类表,计算各因素与感染的X2检验。作者结论:检验。作者结论:6个因素都与术后感染有关。个因素都与术后感染有关。表表1感染与引流时间的关系感染与引流时间的关系引流时间引流时间病人病人3小时小时3
44、小时小时合计合计有感染有感染9050140无感染无感染 120140260OR=2.12=12P0.01影响因素间相互有关系,成为影响因素间相互有关系,成为结果的混杂因素结果的混杂因素 有感染有感染无感染无感染60岁岁60岁岁60岁岁60岁岁3小时小时75(78)15(33)80(80)40(25)3小时小时 20(22)30(67)20(20)120(75)合计合计9545100160OR=7.5OR=12按年龄分层后引流时间与感染按年龄分层后引流时间与感染的关系的关系 60岁岁60岁岁病人病人3小时小时3小时小时病人病人3小时小时3小时小时有感染有感染7520有感染有感染1530无感染无感
45、染8020无感染无感染40120OR=0.92=0.3OR=12=1.2本本例例资资料料用用Logistic回回归归方方法法,分分析析引引起起感感染的危险因素。染的危险因素。Logistic回归的结果回归的结果 变量变量 B Wald Sig.Exp(B)年龄年龄 1.134 19.375 .000 3.107引流引流 0.161 .392 .531 1.175时间时间 结论结论:感染与年龄的大小有关系感染与年龄的大小有关系,与引流时间无与引流时间无关系关系根据设计方案的可行性和科学性的分类根据设计方案的可行性和科学性的分类(加拿大(加拿大McMaster大学的分类)大学的分类)设计设计前瞻前瞻对照对照干预因素干预因素论证论证方案方案研究研究组组和影响结果和影响结果强度强度一级一级是是有有能主动控制能主动控制+二级二级是是有有不能主动控制不能主动控制+三级三级回顾回顾有有不能主动控制不能主动控制+四级四级叙述性叙述性无无非严格的科研设计非严格的科研设计+结 束 谢谢谢谢大大家家
限制150内