区间估计与假设检验讲稿.ppt
《区间估计与假设检验讲稿.ppt》由会员分享,可在线阅读,更多相关《区间估计与假设检验讲稿.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、区间估计与假设检验第一页,讲稿共八十九页哦n3.1 3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念n3.1.1 区间估计区间估计n3.1.2 假设检验假设检验第二页,讲稿共八十九页哦3.1.1 区间估计区间估计1.1.点估计和区间估计点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。点估计是用样本的观测值估计总体未知参数的值。由点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性,不同样本观测值计算得出的参数的估于样本的随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,计值
2、间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参数的置信利用构造的统计量及样本观测值,计算得出参数的置信区间的方法称为参数的区间估计。区间的方法称为参数的区间估计。第三页,讲稿共八十九页哦2.2.参数的置信区间参数的置信区间 在区间估计中,对于总体的未知参数在区间估计中,对于总体的未知参数,需要求出两,需要求出两个统计量个统计量1(X1,X2,.,Xn)和和2(X1,X2,.,Xn)来分来分别估计总体参数别估计总体参数的上限和下限,使得总体参数在区间的上限和下限
3、,使得总体参数在区间(1,2)内的概率为)内的概率为P1 2=1 其中其中1 称为置信水平,而称为置信水平,而(1,2)称为称为的置信区间,的置信区间,1,2分别称为置信下限和置信上限。置信水平为分别称为置信下限和置信上限。置信水平为1 的的含义是随机区间含义是随机区间(1,2)以以1 的概率包含了参数的概率包含了参数。第四页,讲稿共八十九页哦3.3.正态总体均值和方差的置信区间正态总体均值和方差的置信区间 参数的区间估计大多是对正态总体的参数进行估计,参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和如对单总体均值、方差的估计、两总体均值差的估计和
4、两总体方差比的估计等。两总体方差比的估计等。正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。被估参数条件枢轴量及其分布参数的置信区间单正态总体2已知2未知2已知未知第五页,讲稿共八十九页哦正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。其中被估参数条件枢轴量及其分布参数的置信区间两正态总体1-2两样本独立,12,22已知两样本独立,12=22=2 未知两样本独立,1,2未知第六页,讲稿共八十九页哦4.4.总体比例与比例差的置信区间总体比例与比例差的置信区间 实际应用中经常需要对总体比例进行估计,如产品的实际应用中经常需要对总体比例进行估计,如产品的合格率
5、、大学生的就业率和手机的普及率等。记合格率、大学生的就业率和手机的普及率等。记和和P分分别表示总体比例和样本比例,则当样本容量别表示总体比例和样本比例,则当样本容量n很大时很大时(一般当(一般当nP和和n(1 P)均大于均大于5时,就可以认为样本容量时,就可以认为样本容量足够大),样本比例足够大),样本比例P的抽样分布可用正态分布近似。的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表总体比例与比例差的置信区间如表3-2所示。所示。待估参数枢轴量及其分布参数的置信区间总体比例两总体比例差1-2其中P1,P2为两个样本比例 第七页,讲稿共八十九页哦3.1.2 假设检验假设检验1.1.假设
6、检验的基本原理假设检验的基本原理 对总体参数进行假设检验时,首先要给定一个原假设对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设相对立的备择假设H1,H0与与H1有且仅有一个成立;经有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据的事件称为小概率事件),可以依据“小概率事件小概率事件在一次实验中几乎不可能发生在一次实验中几乎不可能发生”的理由,怀疑原假设不的理由,怀疑原假设不真,作出拒
7、绝原假设真,作出拒绝原假设H0,接受,接受H1的决定;反之,若小概的决定;反之,若小概率事件没有发生,就没有理由拒绝率事件没有发生,就没有理由拒绝H0,从而应作出拒绝,从而应作出拒绝H1的决定。的决定。第八页,讲稿共八十九页哦2.2.假设检验的步骤假设检验的步骤 1)根据问题确立原假设根据问题确立原假设H0和备选假设和备选假设H1;2)确定一个显著水平确定一个显著水平,它是衡量稀有性(小概率事,它是衡量稀有性(小概率事件)的标准,常取为件)的标准,常取为0.05;3)选定合适的检验用统计量选定合适的检验用统计量W(通常在原假设中相等(通常在原假设中相等成立时,成立时,W的分布是已知的),根据的
8、分布是已知的),根据W的分布及的分布及 的值,的值,确定确定H0的拒绝域。的拒绝域。4)由样本观测值计算出统计量由样本观测值计算出统计量W的观测值的观测值W0,如果,如果W0落入落入H0的拒绝域,则拒绝的拒绝域,则拒绝H0;否则,不能拒绝原假设;否则,不能拒绝原假设H0。第九页,讲稿共八十九页哦 注意:在注意:在SAS系统中,是由样本观测值计算出统计量系统中,是由样本观测值计算出统计量W的观测值的观测值W0和衡量观测结果极端性的和衡量观测结果极端性的p值(值(p值就是当值就是当原假设成立时得到样本观测值和更极端结果的概率),原假设成立时得到样本观测值和更极端结果的概率),然后比较然后比较p和和
9、 作判断:作判断:p ,拒绝原假设,拒绝原假设H0;p,不,不能拒绝原假设能拒绝原假设H0。第十页,讲稿共八十九页哦 p值通常由下面公式计算而得到。值通常由下面公式计算而得到。p=P|W|W0|=2 P W|W0|(拒绝域为两边对称的区域时)(拒绝域为两边对称的区域时)p=minPW W0,PW W0(拒绝域为两边非对称区域时)(拒绝域为两边非对称区域时)p=PW W0 (拒绝域为右边区域时)(拒绝域为右边区域时)p=PW W0 (拒绝域为左边区域时)(拒绝域为左边区域时)只需根据只需根据SAS计算出的计算出的p值,就可以在指定的显著水值,就可以在指定的显著水平下,作出拒绝或不能拒绝原假设的决
10、定。平下,作出拒绝或不能拒绝原假设的决定。第十一页,讲稿共八十九页哦3.3.正态总体均值和方差的假设检验正态总体均值和方差的假设检验 对正态总体的参数进行假设检验是假设检验的重要内对正态总体的参数进行假设检验是假设检验的重要内容,如对单总体均值、方差的检验、两总体均值之差的容,如对单总体均值、方差的检验、两总体均值之差的检验和两总体方差比的检验等。正态总体参数的各种检检验和两总体方差比的检验等。正态总体参数的各种检验方法见下表验方法见下表3-3至表至表3-5。表表3-3 单正态总体单正态总体N(,2)均值均值的检验法的检验法检验名称条件检验类别H0H1检验统计量分布拒绝域Z检验已知双边检验=0
11、 0N(0,1)|Z|Z/2左边检验 0 0Z Zt检验未知双边检验=0 0t(n 1)|t|t/2(n 1)左边检验 0 0t t(n 1)第十二页,讲稿共八十九页哦表表3-4 单正态总体单正态总体N(,2)方差方差 2的检验法的检验法或检验名称条件检验类别H0H1检验统计量分布拒绝域2检验已知双边检验左边检验右边检验未知双边检验左边检验右边检验第十三页,讲稿共八十九页哦表表3-5 两正态总体的均值差与方差比的检验两正态总体的均值差与方差比的检验名称条件类别H0H1检验统计量分布拒绝域Z检验两样本独立,12=22=2未知双边检验1-2=01-20t(n1+n2 2)左边检验1-201-20t
12、检验成对匹配样本,12,22未知双边检验d=0d0左边检验d0d0F检验两样本独立,1,2未知双边检验F(n11,n21)左边检验右边检验第十四页,讲稿共八十九页哦4.4.总体比例与比例差的检验总体比例与比例差的检验 当样本容量当样本容量n很大时,可根据表很大时,可根据表3-6对总体比例与比例对总体比例与比例差进行假设检验。差进行假设检验。表表3-6 总体比例与比例差的检验总体比例与比例差的检验检验名称检验类别H0H1 检验统计量分布拒绝域比例检验双边检验=0 0N(0,1)|z|z/2左边检验 0 0|z|z两总体比例差检验双边检验1=21 2N(0,1)|z|z/2左边检验1 21 2|z
13、|z第十五页,讲稿共八十九页哦n3.2 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SASSAS实现实现n3.2.1 使用使用INSIGHT模块模块n3.2.2 使用使用“分析家分析家”n3.2.3 使用使用TTEST过程过程第十六页,讲稿共八十九页哦3.2.1 使用使用INSIGHT模块模块1.1.总体均值的区间估计总体均值的区间估计【例例3-1】某药材生产商要对其仓库中的某药材生产商要对其仓库中的1000箱药材的箱药材的平均重量进行估计,药材重量的总体方差未知,随机抽平均重量进行估计,药材重量的总体方差未知,随机抽取取16箱样本称重后结果如表箱样本称重后结果如表3-
14、7所示。所示。表表3-7 16箱药材重量(单位:千克)箱药材重量(单位:千克)设药材重量数据存放于数据集设药材重量数据存放于数据集Mylib.yczl中,其中重中,其中重量变量名为量变量名为weight。求该仓库中每箱药材平均重量在。求该仓库中每箱药材平均重量在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055第十七页,讲稿共八十九页哦步骤如下:步骤如下:1)启动启动INSIGHT模块,并打开数据集模块,并打开数据集Mylib.yczl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在打开的在打开的
15、“Distribution(Y)”对话框中进行区间对话框中进行区间估计的设置(如图)。估计的设置(如图)。第十八页,讲稿共八十九页哦 结果包括一个名为结果包括一个名为“95Confidence Intervals(95%置信区间)置信区间)”的列表,表中给出了均值、标准差、方差的列表,表中给出了均值、标准差、方差的估计值(的估计值(Parameter)、置信下限()、置信下限(LCL)和置信上)和置信上限(限(UCL),如图),如图3-2所示。结果表明,根据抽样样本,所示。结果表明,根据抽样样本,该仓库中药材的平均重量以该仓库中药材的平均重量以95%的可能性位于的可能性位于50.08千克千克至
16、至52.92千克之间。千克之间。第十九页,讲稿共八十九页哦2.2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-2】一家食品厂以生产袋装食品为主,每天的产一家食品厂以生产袋装食品为主,每天的产量大约为量大约为8000袋,每袋重量规定为袋,每袋重量规定为100克。为了分析每克。为了分析每袋重量是否符合要求,质检部门经常进行抽检。现从某袋重量是否符合要求,质检部门经常进行抽检。现从某天生产的一批食品中随机抽取了天生产的一批食品中随机抽取了25袋,测得每袋重量如袋,测得每袋重量如表表3-8所示。所示。表表3-8 25袋食品的重量(单位:克)袋食品的重量(单位:克)试从抽检的样本数据出发,
17、检验变量试从抽检的样本数据出发,检验变量WEIGHT的均值与的均值与100克是否有显著差异。假定表克是否有显著差异。假定表3-8数据存放在数据集数据存放在数据集Mylib.spzl中,重量变量名为中,重量变量名为WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第二十页,讲稿共八十九页哦 设变量设变量WEIGHT的均值为的均值为,问题是希望通过样本数,问题是希望通过样本数据检验变量据检验变量W
18、EIGHT均值的如下假设:均值的如下假设:H0:=100,H1:100。使用使用INSIGHT对均值进行检验的步骤如下:对均值进行检验的步骤如下:1)首先启动首先启动INSIGHT,并打开数据集,并打开数据集Mylib.spzl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在打开的在打开的“Distribution(Y)”对话框中选定分析对话框中选定分析变量变量WEIGHT;4)单击单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;第二十一页,讲稿共八十九页哦 5)选择菜单选择菜单“Tables(表)(表)”“Tests for Loca
19、tion(位置检验)(位置检验)”;在弹出的;在弹出的“Tests for Location”对话框中输入对话框中输入100,单击,单击“OK”按钮得到输出按钮得到输出结果如图所示。结果如图所示。第二十二页,讲稿共八十九页哦 结果显示,观测值不等于结果显示,观测值不等于100克的观测有克的观测有24个,其中个,其中19个观测值大于个观测值大于100。图中第一个检验为图中第一个检验为t检验检验(Students t),需要假定变量,需要假定变量服从正态分布,检验的服从正态分布,检验的p值为值为0.0105,这个检验在,这个检验在0.05水水平下是显著的,所以可认为均值与平下是显著的,所以可认为均
20、值与100克有显著差异。克有显著差异。第二个检验第二个检验(Sign)是叫做符号检验的非参数检验,其是叫做符号检验的非参数检验,其p值值为为0.0066,在,在0.05水平下也是显著的,结论不变。第三水平下也是显著的,结论不变。第三个检验个检验(Sgned Rank)是叫做符号秩检验的非参数检验,是叫做符号秩检验的非参数检验,其其p值为值为0.0048,在,在0.05水平下是显著的,结论不变。水平下是显著的,结论不变。第二十三页,讲稿共八十九页哦3.3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本 在在INSIGHT中比较成对样本均值是否显著差异,可以中比较成对样本均值
21、是否显著差异,可以计算两变量的差值变量,再检验差值变量的均值是否显计算两变量的差值变量,再检验差值变量的均值是否显著为著为0。【例例3-3】由由10名学生组成一个随机样本,让他们分别名学生组成一个随机样本,让他们分别采用采用A和和B两套试卷进行测试,结果如表两套试卷进行测试,结果如表3-9所示。所示。表表3-9 10名学生两套试卷的成绩名学生两套试卷的成绩试从样本数据出发,分析两套试卷是否有显著差异。试从样本数据出发,分析两套试卷是否有显著差异。试卷A78637289914968768555试卷B71446184745155607739差值71911517-21316816第二十四页,讲稿共八
22、十九页哦 步骤如下:步骤如下:1)首先生成差值变量:首先生成差值变量:启动启动INSIGHT,并打开数据集,并打开数据集Mylib.sjcj。选择菜单。选择菜单“Edit”“Variables”“Other”,打开,打开“Edit Variables”对话框,选择对话框,选择A为为Y变量,变量,B为为X变量,然后变量,然后选择变换(选择变换(Transformation):):Y X,如图,生成新的,如图,生成新的差值变量差值变量d;第二十五页,讲稿共八十九页哦 2)然后对变量然后对变量d的均值做如下假设:的均值做如下假设:H0:d=0,H1:d 0。3)选择菜单选择菜单“Analyze”“D
23、istribution(Y)”;在;在打开的打开的“Distribution(Y)”对话框中选定分析变量:对话框中选定分析变量:选择变量差值选择变量差值d,单击,单击“Y”按钮,将变量按钮,将变量d移到右上方移到右上方的列表框中;的列表框中;4)单击单击“Output”按钮,在打开的对话框中选中按钮,在打开的对话框中选中“Tests for Location(位置检验)(位置检验)”复选框;复选框;5)两次单击两次单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;第二十六页,讲稿共八十九页哦 6)选择菜单选择菜单“Tables(表)(表)”“Tests for Locat
24、ion(位置检验)(位置检验)”;在弹出的;在弹出的“Tests for Location”对话框中输入对话框中输入0,单击,单击“OK”按钮得到输出结按钮得到输出结果如图所示。果如图所示。结果显示三个检验的结论都是结果显示三个检验的结论都是p值小于值小于0.05,所以应拒,所以应拒绝原假设,即总体的均值与绝原假设,即总体的均值与0有显著差异。所以两套试有显著差异。所以两套试卷有显著差异。卷有显著差异。虽然虽然SAS给出三个检验结果,其实作结论时只需其中给出三个检验结果,其实作结论时只需其中一个。如果可以认为分析变量服从正态分布只要看一个。如果可以认为分析变量服从正态分布只要看t检验检验结果;
25、否则只须看符号秩检验结果。只有在数据为两两结果;否则只须看符号秩检验结果。只有在数据为两两比较的大小结果而没有具体数值时符号检验才有用。比较的大小结果而没有具体数值时符号检验才有用。第二十七页,讲稿共八十九页哦3.2.2 使用使用“分析家分析家”1.1.总体均值的置信区间总体均值的置信区间【例例3-4】在在“分析家分析家”中求例中求例3-1中每箱药材平均重量中每箱药材平均重量在在95%置信水平下的置信区间。置信水平下的置信区间。步骤如下:步骤如下:1)在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl;2)选择菜单选择菜单“Statistics(统计)(统计)”“Hypo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区间 估计 假设检验 讲稿
限制150内