武汉大学SAST检验.pptx
会计学1武汉大学武汉大学SAST检验检验概述概述 有一批罐头,标称重量有一批罐头,标称重量有一批罐头,标称重量有一批罐头,标称重量500500g g,据以往经验,据以往经验,据以往经验,据以往经验,标准公差为标准公差为标准公差为标准公差为2020g g;现抽现抽现抽现抽100100罐,罐,罐,罐,X=505gX=505g,问是问是问是问是否可以认为合乎标准?否可以认为合乎标准?否可以认为合乎标准?否可以认为合乎标准?今年小白菜与去年的今年小白菜与去年的今年小白菜与去年的今年小白菜与去年的1.981.98元元元元/公斤是否有显著公斤是否有显著公斤是否有显著公斤是否有显著变化?变化?变化?变化?美国法律:无罪推定美国法律:无罪推定美国法律:无罪推定美国法律:无罪推定 原假设原假设原假设原假设H0H0:被告无罪被告无罪被告无罪被告无罪 备择假设备择假设备择假设备择假设H1H1:被告有罪被告有罪被告有罪被告有罪 注:不能证明其有罪便认为无罪注:不能证明其有罪便认为无罪注:不能证明其有罪便认为无罪注:不能证明其有罪便认为无罪第1页/共33页特点特点有标准值、经验值或者根据其他途径所导引的假设及猜测值,并欲对此做进一步的检验“慎重”的态度,不轻易否定:参考西方法律,重证据,不能证明其有罪,便判为无罪第2页/共33页检验的设计检验的设计n n检验一批罐头,重要的指标之一是其均值检验一批罐头,重要的指标之一是其均值是否与标称值是否与标称值500500g g有明显的差异?有明显的差异?n n办法一:办法一:n n普查,求出普查,求出m m m m,既可知标称值的差异有多大既可知标称值的差异有多大(或可判定差异是否在给定的许可范围之)(或可判定差异是否在给定的许可范围之)?n n但费时费力,有时甚至不可行但费时费力,有时甚至不可行n n办法二:办法二:n n因尚无证据表明存在明显差异,所以取慎重因尚无证据表明存在明显差异,所以取慎重态度,先作假设态度,先作假设H0:m H0:m H0:m H0:m=m0=500 m0=500 m0=500 m0=500n n注:此处的注:此处的“=”是表意的,应理解为是表意的,应理解为“差不多差不多”第3页/共33页检验的设计检验的设计n n如如H H0 0成立,则应该在成立,则应该在500500的周围;的周围;n n于是,在于是,在H H0 0:m m m m 与与与与m0m0m0m0 差不多的假设差不多的假设下有图下有图第4页/共33页检验的设计检验的设计n n当 距离m 较远(一般可先给定两角各a/2a/2a/2a/2的面积)n n当进入该面积时,则判定为“较远”。n n见图a/2a/2临界点临界点临界点临界点第5页/共33页一、假设检验一、假设检验例:欲知道今年小白菜与去年的1.98元/公斤是否有显著变化?零假设:今年的价格是1.98对立假设:今年的价格不是1.981.假设检验的过程对样本作一个零假设,然后通过计算样本的统计量,并根据得到的P值检验数据是否支持零假设。第6页/共33页一、假设检验一、假设检验2.假设检验的P值表示在假设为真的条件下,能够取到所计算的统计量的概率值。P值很小:拒绝零假设,统计量的值不可能合理地偶然取到。P值较大:不拒绝零假设,统计量的值在零假设为真的条件下可能偶然地取到。第7页/共33页一、假设检验一、假设检验3.统计显著性是选择显著性水平控制犯错误风险的一种方式。一般取值如下:0.10中等显著0.05显著0.01非常显著第8页/共33页假设检验的过程假设检验的过程选择零假设和对立假选择零假设和对立假设设根据样本数据计算统根据样本数据计算统计量,计算计量,计算P值值把把P值同显著性水平比值同显著性水平比较并作出判断较并作出判断第9页/共33页二、均值比较二、均值比较引例:上海市男性律师比女性律师收入高吗?对病人治疗前后生理指标的变化显著吗?两组数据均值比较需要解决的问题:(1)判断两组独立还是有成对关系(2)概括两组数据(3)用SAS建立统计假设进行检验(4)解释SAS的输出第10页/共33页二、均值比较二、均值比较独立组:男女律师的收入(任一男性律师工资与任一女性律师工资毫不相干)成对组:治疗前后生理指标的变化。第11页/共33页三、三、T检验简介检验简介1.T检验的意义两样本某变量均值不同,其差异是否具有统计意义?第12页/共33页三、三、T检验检验1.样本均数与总体均数差别的显著性样本均数与总体均数差别的显著性检验检验例:已知某水样中含例:已知某水样中含CaCo3的的真值为真值为20.7mg/L,现用某方法重复测定该水现用某方法重复测定该水样样11次,次,CaCo3的含量为的含量为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20,23,22。问用该法。问用该法测水中测水中CaCo3的含量所得的均值与真的含量所得的均值与真值有无显著差别?值有无显著差别?第13页/共33页1.样本均数与总体均数差别的显样本均数与总体均数差别的显著性检验著性检验v数据集的建立数据集的建立v将数据复制到将数据复制到word中,用查找替换的功能中,用查找替换的功能将数据之间的分隔符逗号替换成回车符号将数据之间的分隔符逗号替换成回车符号v在在word中将数据转换成表格,并复制中将数据转换成表格,并复制v在在excel中用选择性粘贴,粘贴文本,并中用选择性粘贴,粘贴文本,并编辑数据,求出差值,存为文本文件编辑数据,求出差值,存为文本文件v转成转成SAS数据集数据集第14页/共33页1.样本均数与总体均数差别的显样本均数与总体均数差别的显著性检验著性检验v用分析员应用进行用分析员应用进行T检验检验wsolutions/Analysis/Analystw打开数据集打开数据集wStatistics/Hypothesis Tests/One-Sample t-test for a meanw选择变量选择变量VariablewOK第15页/共33页1.样本均数与总体均数差别的显著性检验样本均数与总体均数差别的显著性检验v程序实现程序实现T检验检验DATA T1;INPUT X;Y=X-20.7;CARDS;20.99 20.41 20.10 20.00 20.9122.60 20.99 20.41 20 23 22proc means mean std stderr t prt data=t1;var y;run;第16页/共33页1.样本均数与总体均数差别的显样本均数与总体均数差别的显著性检验著性检验v检验结果的分析:检验结果的分析:0.3125,按,按=0.05 水平,不拒水平,不拒绝绝H0假设。因此,该方法所假设。因此,该方法所测出水中测出水中CaCo3含量的均值与含量的均值与真值无显著差异。此法可信。真值无显著差异。此法可信。第17页/共33页应用克矽平治疗前后应用克矽平治疗前后10名患者血名患者血红蛋白的含量如下,问该药是否会红蛋白的含量如下,问该药是否会引起血红蛋白的变化?引起血红蛋白的变化?治疗前:治疗前:11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3治疗后:治疗后:14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.02.同一批实验对象前后差异的显同一批实验对象前后差异的显著性检验(配对著性检验(配对T检验)检验)第18页/共33页参考程序:参考程序:Data t2;Input x y;d=x-y;Cards;11.3 14.0 15.0 13.8 15.0 14.0 13.5 13.5 12.8 13.510.0 12.0 11.0 14.7 12.0 11.4 13.0 13.8 12.3 12.0Proc means mean std stderr t prt;Var d;Run;2.同一批实验对象前后差异的显同一批实验对象前后差异的显著性检验(配对著性检验(配对T检验)检验)第19页/共33页用用SAS/ASSIST来作来作t检验检验 点击点击solution/assist/data analysis/anova/t-tests 单击单击paired comparisons(配对检验)配对检验)激活激活sas数据集数据集 单击单击 paired colums(配对变量),选用配对变量),选用X,Y单击单击run/submit 结果分析:无显著差异结果分析:无显著差异2.同一批实验对象前后差异的显同一批实验对象前后差异的显著性检验(配对著性检验(配对T检验)检验)第20页/共33页某公司生产某打印机,它有某公司生产某打印机,它有20个固定的客户,个固定的客户,每个客户的需求量都有记录,公司做了大量广告每个客户的需求量都有记录,公司做了大量广告后,这后,这20个客户的需求量发生了变化,现在希望个客户的需求量发生了变化,现在希望知道广告宣传是否起到了显著的作用。知道广告宣传是否起到了显著的作用。客户序号:客户序号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20较早的销量:较早的销量:125 265 337 59 69 456 205 302 100 50 92 84 63 49 163 277 25 360 52 88广告后销量:广告后销量:150 233 386 67 60 400 255 260 120 50 89 99 63 50 180 290 60 350 65 962.同一批实验对象前后差异的显同一批实验对象前后差异的显著性检验(配对著性检验(配对T检验)检验)第21页/共33页两种饲料喂两种饲料喂8对大白鼠后,测得其肝中维生素对大白鼠后,测得其肝中维生素A的含量(的含量(IU/mg),),问不同饲料组大白鼠肝中问不同饲料组大白鼠肝中维生素维生素A的含量有无显著差别(实验中条件相的含量有无显著差别(实验中条件相近者配成一对)。近者配成一对)。正常组:正常组:3.55 2.00 3.00 3.95 3.80 3.75 3.45 3.05缺乏缺乏VE组:组:2.45 2.40 1.80 3.20 3.25 2.70 2.50 1.753.同源配对资料差异的显著性检同源配对资料差异的显著性检验(配对验(配对T检验)检验)第22页/共33页Data ttest3(drop=i);Do I=1 to 8;Input x1 x2;output;End;Cards;3.55 2.45 2.00 2.40 3.00 1.80 3.95 3.20 3.80 3.25 3.75 2.70 3.45 2.50 3.05 1.75Run;3.同源配对资料差异的显著性检同源配对资料差异的显著性检验(配对验(配对T检验)检验)第23页/共33页3.同源配对资料差异的显著性检同源配对资料差异的显著性检验(配对验(配对T检验)检验)用分析员应用来作用分析员应用来作t检验检验 进入分析员应用进入分析员应用,打开数据集打开数据集ttest3选择选择two sample Paired t-test for Means(配对配对T检检验)验)将变量将变量x1选入选入group1框中,框中,x2选入选入group2框中框中ok结果分析:不同饲料组大白鼠肝中维生素结果分析:不同饲料组大白鼠肝中维生素A的的含量有显著差别(含量有显著差别(p=0.004)第24页/共33页3.独立样本独立样本T检验检验随机将随机将20只雄性大白鼠分为甲、乙两组,只雄性大白鼠分为甲、乙两组,甲组大鼠不接受任何处理(即空白对照)甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受,乙组中的每只大鼠接受3mg/kg的内毒的内毒素。分别测得两组大白鼠的肌酐素。分别测得两组大白鼠的肌酐(umol/l)数据,试检验两总体均数之间数据,试检验两总体均数之间的差别是否有显著性?的差别是否有显著性?甲组:甲组:548.1327.1512.7238.7344.8539.2592.3689.5335.9610.0乙组:乙组:751.4601.1998.9831.0822.1645.3495.0698.4636.5724.9第25页/共33页3.独立样本独立样本T检验检验数据集的建立数据集的建立(方式方式1):data a(drop=i);do x1=1 to 2;do i=1 to 10;input x2;output;end;end;cards;548.1 327.1 512.7 238.7 344.8 539.2 592.3 689.5 335.9 610.0751.4 601.1 998.9 831.0 822.1 645.3 495.0 698.4 636.5 724.9run;第26页/共33页3.独立样本独立样本T检验检验数据集的建立(方式2):data b(drop=i);do i=1 to 10;input x1 x2;output;end;cards;548.1 751.4 327.1 601.1 512.7 998.9238.7 831.0 344.8 822.1 539.2 645.3 592.3 495.0 689.5 698.4 335.9 636.5 610.0 724.9 run;第27页/共33页3.独立样本独立样本T检验检验进入分析员应用进入分析员应用,打开数据集打开数据集a选择选择two sample test for variances(两样本方差检验法)两样本方差检验法)对话框对话框group are in 部分选部分选one variable(有一分组变量有一分组变量X1)。)。将变量将变量x2选入选入dependent因变量框中,因变量框中,x1选入选入group分组变量框中分组变量框中 在在hypotheses(假设)部分的备选假设栏中使假设)部分的备选假设栏中使variance1/variance2=1选项被选中选项被选中 经检验数据资料满足正方差齐性经检验数据资料满足正方差齐性(p=0.8571),故可以用故可以用一般一般t检验法检验法选择选择two sample T-test for means(两样本均值检验法)两样本均值检验法)经检验两总体均数之间有显著性的差别经检验两总体均数之间有显著性的差别p=0.0014第28页/共33页3.独立样本独立样本T检验检验进入分析员应用进入分析员应用,打开数据集打开数据集b选择选择two sample test for variances(两样本方差两样本方差检验法)检验法)对话框对话框group are in 部分选部分选two variable。将变量将变量x1选入选入group1变量框中,变量框中,x2选入选入group2变量框中变量框中 经检验数据资料满足正方差齐性经检验数据资料满足正方差齐性(p=0.8571)选择选择two sample T-test for means(两样本均值检两样本均值检验法)验法)经检验两总体均数之间有显著性的差别经检验两总体均数之间有显著性的差别p=0.0014第29页/共33页3.独立样本独立样本T检验检验分析参加体型锻炼的男女体脂有无显著分析参加体型锻炼的男女体脂有无显著性差异性差异男:男:13.3 19 20 8 18 22 20 31 21 12 16 12 24女女:22 26 16 12 21.7 23.2 21 28 30 23试检验某班男生和女生数学成绩是否有试检验某班男生和女生数学成绩是否有显著差异。显著差异。男生:男生:95 80 84 92 75 77 86 89女生:女生:90 93 97 82 85 90 89 86 第30页/共33页SAS实习(5)一、同一班级学生两次考试成绩如下:学生编号1,2,3,4,5,6,7,8,9,10,11,12,13,14,15第1次考试:80,73,70,60,88,84,65,37,91,98,52,78,40,79,59第2次考试:82,71,95,69,100,71,75,60,95,99,65,83,60,86,62试问前后两次考试成绩有无显著差异?第31页/共33页二、某班学生有男有女,检验某班学生在网球的球技上是否有显著的不同.男,女同学球技得分如下:男生组:82,80,85,85,78,87,82女生组:75,76,80,77,80,77,73试作差异性检验。将作该检验的程序以TEST2.SAS为名、检验结果以TEST2.TXT为名存入D盘你的文件夹中。第32页/共33页