假设检验数学建模算法精选PPT.ppt
《假设检验数学建模算法精选PPT.ppt》由会员分享,可在线阅读,更多相关《假设检验数学建模算法精选PPT.ppt(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验数学建模算法第1页,此课件共103页哦假设检验在统计方法中的地位第2页,此课件共103页哦6.1 假设检验的基本问题一、假设的陈述一、假设的陈述二、两类错误与显著性水平二、两类错误与显著性水平三、统计量与拒绝域三、统计量与拒绝域四、利用四、利用P值进行决策值进行决策第3页,此课件共103页哦一、假设的陈述1、假设和假设检验、假设和假设检验 假假设设是对总体参数的具体数值所作的陈述n总体参数包括总总体体均均值值、比比率率、方差方差等n分析之前之前必须陈述我认为这种新药的疗效比原有我认为这种新药的疗效比原有的药物更有效的药物更有效!第4页,此课件共103页哦1.假假设设检检验验:先对总体的
2、参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理第5页,此课件共103页哦假设检验的基本思想.因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假设设设设设设 =50=50=50.如果这是总如果这是总如果这是总如果这是总如果这是总如果这是总体的假设均值体的假设均值体的假设均值体的假设均值体的假设均值体的假设均值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个
3、值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 .202020第6页,此课件共103页哦总体总体假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择!作出决策作出决策作出决策作出决策第7页,此课件共103页哦小概率原理o 什么小概率?什么小概率?o1.在一次试验中,一个几乎不可能发生的事件发生的概率o2.在一次试验中小概率事件一旦发生,我们就
4、有理由拒绝原假设o3.小概率由研究者事先确定第8页,此课件共103页哦2、原假设与备择假设p原假设原假设(null hypothesis):研究者想收集证据予以反对的假设。表示为H0H0:=,或 某一数值 例如,H0:10cmp备择假设备择假设(alternative hypothesis):研究者想收集证据予以支持的假设。表示为H1 H1:,或 某一数值 例如,H1:10cm,10cm,或 10cm第9页,此课件共103页哦o【例例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或
5、小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“生生生产过程不正常产过程不正常产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm 10cm 10cm 第10页,此课件共103页哦o【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发
6、,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立立立的的的原原原假假假设设设和和和备备备择择择假设为假设为假设为 H HH0 0:500 500 H HH1 1 1:500 500”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n备择假设
7、的方向为“”,称为右侧检验右侧检验 3、双侧检验与单侧检验、双侧检验与单侧检验第14页,此课件共103页哦双侧检验与单侧检验(假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0第15页,此课件共103页哦二、假设检验中的两类错误o1.第第类错误类错误(弃真错误弃真错误)n原假设为真时拒绝原假设n第类错误的概率记为o被称为显著性水平o2.第第类错误类错误(取伪错误取伪错误)n原假设为假时未拒绝原假设n第 类 错 误 的 概 率 记 为(Beta)第16页,此课件共103页哦
8、H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误()拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-)假设检验就假设检验就假设检验就好像一场审判过程好像一场审判过程好像一场审判过程统计检验过统计检验过统计检验过程程程第17页,此课件共103页哦 错误和 错误的关系 你不能同时减少你不能同时减少两类错误两类错误!和和和和
9、 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就大,就大,就大,就大,大大大大 就小就小就小就小第18页,此课件共103页哦显著性水平(significant level)1.原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域2.它是事先指定的犯第类错误概率的最大允许值3.常用的 值有0.01,0.05,0.104.由研究者事先确定5.拒绝原假设,则表明检验的结果是显著的 不拒绝原假设,表明检验的结果是不显著的第19页,此课件共103页哦三、检验统计量与拒绝域第20页,此课件共103页哦1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的
10、某个样本统计量2.对样本估计量的标准化结果n原假设H0为真n点估计量的抽样分布 检验统计量检验统计量(test statistic)3.3.标准化的检验统计量标准化的检验统计量 第21页,此课件共103页哦显著性水平和拒绝域(双侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布0 0 0临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平第22页,此课件共103页哦显著性水平和拒绝域(双侧检验)0 0临界值临界值临界值临界值/2/2/2/
11、2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H0H0抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第23页,此课件共103页哦显著性水平和拒绝域(双侧检验)0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第24页,此课件共103页哦显著性水平和拒绝域(双侧检验)0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第25页,此课件共103页哦显著性水平和
12、拒绝域(单侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第26页,此课件共103页哦显著性水平和拒绝域(左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第27页,此课件共103页哦显著性水平和拒绝域(左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本
13、统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第28页,此课件共103页哦显著性水平和拒绝域(右侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第29页,此课件共103页哦显著性水平和拒绝域(右侧检验)0 0 0临界值临界值临界值
14、样本统计量样本统计量样本统计量抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝拒绝拒绝H HH0 00第30页,此课件共103页哦决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与 水平的临界值进行比较3.作出决策n双侧检验:统计量 临界值,拒绝H0n左侧检验:统计量 临界值,拒绝H0第31页,此课件共103页哦四、利用 P 值 进行决策第32页,此课件共103页哦什么是P 值?(P-value)1.在原假设为真的条件下,检验统计量大于、小于或等于其计算值的概率n双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设H0之间不一
15、致的程度3.决策规则:若p值,拒绝 H0第33页,此课件共103页哦双侧检验的P 值 /2 2 /2 2 Z拒绝拒绝拒绝H0H0H0拒绝拒绝拒绝H0H0H00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第34页,此课件共103页哦左侧检验的P 值0 0 0临界值临界值临界值 样本统计量样本统计量样本
16、统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值第35页,此课件共103页哦右侧检验的P 值0 0 0临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值第36页,此课件共103页哦假设检验步骤的总结1.陈述原假设
17、和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策n统计量的值落在拒绝域,拒绝H0,否则不拒绝H0n也可以直接利用P值值作出决策第37页,此课件共103页哦6.2 一个总体参数的检验一、总体均值的检验一、总体均值的检验二、总体比率的检验二、总体比率的检验三、总体方差的检验三、总体方差的检验第38页,此课件共103页哦一个总体参数的检验z z 检验检验检验检验(单尾和双尾单尾和双尾单尾和双尾单尾和双尾)t t 检验检验检验检验(单尾和双尾单尾和
18、双尾单尾和双尾单尾和双尾)z z 检验检验检验检验(单尾和双尾单尾和双尾单尾和双尾单尾和双尾)检验检验检验检验(单尾和双尾单尾和双尾单尾和双尾单尾和双尾)均值均值均值均值一个总体一个总体一个总体一个总体比率比率比率比率方差方差方差方差第39页,此课件共103页哦一、总体均值的检验o检验统计量确定的因素:检验统计量确定的因素:1、样本容量的大小2、总体分布形状3、总体方差是否已知o总体均值检验统计量主要有:总体均值检验统计量主要有:1、z检验统计量2、t检验统计量第40页,此课件共103页哦总体均值的检验(大样本)1.假定条件n正态总体或非正态总体大样本(n30)2.使用 z检验统计量n 2 已
19、知:n 2 未知:第41页,此课件共103页哦总体均值的检验(2 已知)(例题分析)o【例例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验双侧检验绿色绿色绿色绿色健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品255255255255255255第42页,此课件共103页哦总体均值的检验(2 已知)(例题分析)oH0:=255oH1:255o =0.05on=40o临界值临界值(Zc
20、):检验统计量检验统计量检验统计量检验统计量:z z0 01.961.96-1.961.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策决策决策决策:结论结论结论结论:不拒绝不拒绝H H0 0样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮料符合标准要求饮料符合标准要求 第43页,此课件共103页哦总体均值的检验(z检验)(P 值的计算与应用)o第第1步步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)o第第2步:步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定o第第3步:步:将 z 的绝
21、对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0第44页,此课件共103页哦总体均值的检验(2 未知)(例题分析)o【例例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据(mm)1.261.19
22、1.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第45页,此课件共103页哦总体均值的检验(2 未知)(例题分析)oH0:1.35oH1:1.35o =0.01on=50o临界值临界值(c):检验统计量检验统计量:拒绝拒绝H H0 0新新机机床床加加工工的的零零件
23、件尺尺寸寸的的平平均均误误差差与与旧旧机床相比有显著降低机床相比有显著降低决策决策决策决策:结论结论:-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01第46页,此课件共103页哦总体均值的检验(z检验)(P 值的计算与应用)o第第1步:步:进入Excel表格界面,直接点击“f(x)”o第第2步步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定o第第3步:步:在所出现的对话框Array框中,输入原始数据所在区 域;在X后输入参数的某一假定值(这里为1.35);在 Sigma后输入已知的总体标准差(若未总体标准差未 知则可忽略不填,系统将自动使用样本标
24、准差代替)o第第4步:步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值 5200o =0.05on=36o临界值临界值(c):检验统计量检验统计量:拒绝拒绝H H0 0(P P=0.000088 0.000088 =0.05)=0.05)改良后的新品种产量有显著提高改良后的新品种产量有显著提高 决策决策决策决策:结论结论结论结论:z z0 0拒绝拒绝H H0 00.050.051.6451.645第50页,此课件共103页哦总体均值的检验(z检验)(P 值的图示)抽样分布抽样分布抽样分布抽样分布P P P=0.0000880.0
25、000880.000088 0 0 01.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=3.75=3.75=3.75P P P 值值值第51页,此课件共103页哦总体均值的检验(大样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0H1:0H0:0H1:0统计量统计量 已知:未知:拒绝域拒绝域P值决策值决策拒绝H0第52页,此课件共103页哦总体均值的检验(小样本)o1.假定条件n总体服从正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 数学 建模 算法 精选 PPT
限制150内