第四章假设检验简略版.ppt
《第四章假设检验简略版.ppt》由会员分享,可在线阅读,更多相关《第四章假设检验简略版.ppt(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4-1统计学统计学第第 4 章章 假设检验假设检验统计学4-2统计学统计学第第 4 章章 假设检验假设检验4.1 假设检验的基本问题假设检验的基本问题 4.2 一个正态总体参数的检验一个正态总体参数的检验4.3 两个正态总体参数的检验两个正态总体参数的检验4.4 假设检验中的其他问题假设检验中的其他问题4-3统计学统计学假设检验在统计方法中的地位假设检验在统计方法中的地位4-4统计学统计学学习目标学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用利用P-值进行假设检验值进行假设检验4-5统计学统
2、计学4.1 假设检验的基本问题假设检验的基本问题一一.假设检验的概念和思想假设检验的概念和思想二二.假设检验的步骤假设检验的步骤三三.小概率原理小概率原理四四.两类错误两类错误五五.原假设预备择假设的确定原假设预备择假设的确定六六.假设检验中的假设检验中的P值值4-6统计学统计学假设检验的概念与思想假设检验的概念与思想4-7统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)再看一个例子:某味精厂用一台包装机自动包装味精,已知袋装味精的重量XN(u,0.0152),机器正常时其均值u0=0.5公斤,某日开工后随机抽取9袋袋装味精,其净重为:0.497,0.506,
3、0.518,0.524,0.498,0.511,0.520,0.515,0.512问这台机器是否正常?4-8统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)解:已知袋装味精的重量解:已知袋装味精的重量XN(u,0.015XN(u,0.0152 2),),假设现假设现在包装机工作正常在包装机工作正常,即提出如下假设即提出如下假设 :原假设原假设原假设原假设H H0 0:=0 0=0.5=0.5 备择假设备择假设备择假设备择假设H H1 1:0 0=0.5=0.5当原假设为真时当原假设为真时当原假设为真时当原假设为真时,4-9统计学统计学什么是假设检验什么是假设检
4、验?(hypothesis testing)当原当原假设为真时假设为真时,对于对于给定的很小的数给定的很小的数0000 1111,例如例如例如例如 =0.05,0.05,有有有有其中其中其中其中,Z,Z a/2 a/2为标准正态分为标准正态分为标准正态分为标准正态分布上侧布上侧布上侧布上侧a/2a/2分位数分位数分位数分位数.Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-10统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)可见,假设检验是一种带有概率性质的反证法.纯数学的反证法,
5、是在假设成立的条件下推出逻辑上的绝对矛盾.这里所说的带有概率性质的反证法,是依据实际推断原理.即认为小概率事件在一次试验中几乎不可能发生.统计上的假设检验,即根据样本检验一个发生概率很小的事件是否发生,若发生了即认为假设有问题,则拒绝原假设.4-11统计学统计学参数假设检验与非参数假设检验参数假设检验与非参数假设检验1.参数假设检验需要对总体分布作出某种假设,然后利用样本信息来判断关于总体的参数的原假设是否成立,效率高,但要求已知总体分布类型2.非参数假设检验则是一种不依赖于总体分布的检验方法,检验条件较宽松,适应性强,但功效较低。(含总体的分布类型检验及独立性检验等)4-12统计学统计学参数
6、假设检验与非参数假设检验参数假设检验与非参数假设检验 数值变量 分布类型检验(正态性检验)某种分布(正态)非某种分布(非正态)参数检验 非参数检验 4-13统计学统计学假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值,判断落入拒绝域还判断落入拒绝域还是接受域是接受域作出统计决策作出统计决策4-14统计学统计学提出原假设和备择假设提出原假设和备择假设 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号 ,
7、或 4.表示为 H0n nH H0 0:某一数值某一数值 n n指定为指定为 =号,即号,即 或或 n n例如例如,H H0 0:31903190(克)克)4-15统计学统计学 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设,总是有不等号:,或 3.表示为 H1n nH H1 1:某一数值,或某一数值,或 某一数值某一数值n n例如例如,H H1 1:3190(1020 1020 =0.050.05n n =1616临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检
8、验统计量:在在 =0.0.0505的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.6454-35统计学统计学 2 未知,大样本均值的检验未知,大样本均值的检验(例题分析例题分析)【例例例例】某某电电子子元元件件批批量量生生产产的的质质量量标标准准为为平平均均使使用用寿寿命命12001200小小时时。某某厂厂宣宣称称他他们们采采用用一一种种新新工工艺艺生生产产的的元元件件质质量量大大大大超超过过规规定定标标准准。为为了了进进行行验验证证,随随机
9、机抽抽取取了了100100件件作作为为样样本本,测测得得平平均均使使用用寿寿命命12451245小小时时,标标准准差差300300小小时时。能能否否说说该该厂厂生生产产的的电电子子元元件件质质量量显显著著地地高高于规定标准?于规定标准?(0.0.0505)单侧单侧检验检验4-36统计学统计学 2 未知,大样本均值的检验未知,大样本均值的检验(例题分析例题分析)H H0 0:12001200H H1 1:1200 1200 =0.050.05n n=100100临界值临界值临界值临界值(s):s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒
10、绝H H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时H H0 0:12001200决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.6454-37统计学统计学原假设与备择假设的选择例题原假设与备择假设的选择例题H H0 0:12001200H H1 1:1200 1200 =0.050.05n n=100100临界值临界值临界值临界值(s):s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0即不能认为该厂生产的元件寿即不能认为该厂
11、生产的元件寿命显著地低于命显著地低于12001200小时小时H H0 0:12001200决策决策决策决策:结论结论结论结论:-1.6451.645Z Z0 0拒绝域拒绝域.05054-38统计学统计学总体均值的检验总体均值的检验(2未知小样本未知小样本)1.假定条件n n总体为正态分布总体为正态分布n n 2 2未知,且小样本未知,且小样本2.使用t 统计量4-39统计学统计学 2 未知小样本均值的检验未知小样本均值的检验(例题分析例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的
12、显著性水平检验机器性能良好的假设。双侧检验双侧检验4-40统计学统计学 2 未知小样本均值的检验未知小样本均值的检验(例题分析例题分析)H H0 0:=5=5H H1 1:5 5 =0.05=0.05dfdf =10=10-1=9-1=9临界值临界值临界值临界值(s):s):检验统计量检验统计量检验统计量检验统计量:在在 =0.0.0505的水平上拒绝的水平上拒绝H H0 0在在 =0.05=0.05的水平上的水平上说明该说明该机器的性能不好机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0
13、 0拒绝拒绝 H H0 0.025.0254-41统计学统计学 2 未知小样本均值的检验未知小样本均值的检验(P 值的计算与应用值的计算与应用)第第1 1步步:进进入入ExcelExcel表表格格界界面面,选选择择“插插入入”下下拉拉菜菜单单第第2 2步步:选选择择“函函数数”点点击击,并并在在函函数数分分类类中中点点击击“统统 计计”,然后,在函数名的菜单中选择字符,然后,在函数名的菜单中选择字符 “TDISTTDIST”,确定确定第第3 3步:步:在弹出的在弹出的X X栏中录入计算出的栏中录入计算出的t t值值3.16 3.16 在自由度在自由度(Deg-freedomDeg-freedo
14、m)栏中录入栏中录入9 9 在在TailsTails栏中录入栏中录入2 2,表明是双侧检验,表明是双侧检验(单测单测 检验则在该栏内录入检验则在该栏内录入1 1)P P值的结果为值的结果为0.011550.0250.01155 40000 40000 =0.=0.0505dfdf =20-1=1920-1=19临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.0.0505的水平上不能拒绝的水平上不能拒绝H H0 0无证据表明轮胎使用寿命显著无证据表明轮胎使用寿命显著地大于地大于4000040000公里公里决策决策决策决策:结论结论结论结论:t t0
15、0拒绝域拒绝域0.050.051.72911.72914-44统计学统计学总体比例的检验总体比例的检验(Z 检验检验)4-45统计学统计学适用的数据类型适用的数据类型4-46统计学统计学一个总体比例检验一个总体比例检验1.假定条件n n有两类结果有两类结果n n总体服从二项分布总体服从二项分布n n可用正态分布来近似可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例4-47统计学统计学一个总体比例的检验一个总体比例的检验(例题分析例题分析)【例例例例】一一项项统统计计结结果果声声称称,某某市市老老年年人人口口(年年龄龄在在656
16、5岁岁以以上上)的的比比重重为为14.714.7%,该该市市老老年年人人口口研研究究会会为为了了检检验验该该项项统统计计是是否否可可靠靠,随随机机抽抽选选了了400400名名居居民民,发发现现其其中中有有5757人人年年龄龄在在6565岁岁以以上上。调调查查结结果果是是否否支支持持该该市市老老年年人人口口比比重重为为14.7%14.7%的看法?的看法?(=0.050.05)双侧检验双侧检验4-48统计学统计学一个总体比例的检验一个总体比例的检验(例题分析例题分析)H H0 0:=14.7%=14.7%H H1 1:14.7%14.7%=0.05=0.05n n =400400临界值临界值临界值
17、临界值(s):s):检验统计量检验统计量检验统计量检验统计量:在在 =0.0.0505的水平上不能拒绝的水平上不能拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策:结论结论结论结论:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-49统计学统计学总体方差的检验总体方差的检验(2 检验检验)4-50统计学统计学方差的卡方差的卡方方(2)检验检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设
18、的总体方差假设的总体方差4-51统计学统计学方差的卡方差的卡方方(2)检验检验(例题分析例题分析)【例例例例】某某厂厂商商生生产产出出一一种种新新型型的的饮饮料料装装瓶瓶机机器器,按按设设计计要要求求,该该机机器器装装一一瓶瓶一一升升(10001000cmcm3 3)的的饮饮料料标标准准误误差差上上下下不不超超过过1 1cmcm3 3。如如果果达达到到设设计计要要求求,表表明明机机器器的的稳稳定定性性非非常常好好。现现从从该该机机器器装装完完的的产产品品中中随随机机抽抽取取2525瓶瓶,分分 别别 进进 行行 测测 定定(用用 样样 本本 减减10001000cmcm3 3),得得到到如如下下
19、结结果果。检检验验该该机机器器的的性性能能是是否否达达到到设设计计要求要求 (=0.0.0505)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验4-52统计学统计学方差的卡方差的卡方方(2)检验检验(例题分析例题分析)H H0 0:2 2=1=1H H1 1:2 2 1 1 =0.=0.0505dfdf =25-1=2425-1=24临界值临界值临界值临界值(s)
20、:s):统计量统计量统计量统计量:在在 =0.050.05的水平上不能拒绝的水平上不能拒绝H H0 0可以认为该机器的性能达到设可以认为该机器的性能达到设计要求计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2=.05/2=.05/2=.05决策决策决策决策:结论结论结论结论:4-53统计学统计学8.3 两个正态总体参数的检验两个正态总体参数的检验一一.检验统计量的确定检验统计量的确定二二.两个总体均值之差的检验两个总体均值之差的检验三三.两个总体比例之差的检验两个总体比例之差的检验四四.两个总体方差比的检验两个总体方差比的检验五五.检验中的匹配样本检
21、验中的匹配样本4-54统计学统计学两个正态总体参数的检验两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差4-55统计学统计学独立样本总体均值之差的检验独立样本总体均值之差的检验4-56统计学统计学两个独立样本之差的抽样分布两个独立样本之差的抽样分布 1 1总体总体1 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对
22、样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1-2 22 2抽样分布抽样分布抽样分布抽样分布4-57统计学统计学两个总体均值之差的两个总体均值之差的检验检验(12、22 已知已知)1.1.假定条件假定条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n n1 1 3030和和 n n2 2 30)30)2.检验统计量为检验统计量为4-58统计学统计学两个总体均值之差的检验两个总体均值之差的检验(假设的形式假设的形式)假设假设
23、研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0 1 1 2 2=0=0 1 1 2 2 0 0 1 1 2 2 0 0H1 1 1 2 2 0 0 1 1 2 2 0 0 04-59统计学统计学两个总体均值之差的检验两个总体均值之差的检验(例题分析例题分析)双侧检验!双侧检验!【例例例例】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。根根据据以以往往的的资资料料得得知知,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,第第
24、二二种种方方法法的的标标准准差差为为1010公公斤斤。从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,样样本本容容量量分分别别为为n n1 1=32=32,n n2 2=40=40,测测得得 x x2 2=5050公公斤斤,x x1 1=4444公公斤斤。问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是否有显著差别?是否有显著差别?(=0.05=0.05)4-60统计学统计学两个总体均值之差的检验两个总体均值之差的检验(例题分析例题分析)H H0 0:1 1 1 1-2 2 2 2=0=0H H1 1:1 1 1 1-2 2 2 2 0
25、0 =0.050.05n n1 1 =32 32,n n2 2 =4040临界值临界值临界值临界值(s):s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-61统计学统计学两个总体均值之差的两个总体均值之差的检验检验(12、22 未知且不相等未知且不相等,小样本小样本)1.检验具
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 假设检验简略版 第四 假设检验 简略
限制150内