非参数检验解析优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《非参数检验解析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《非参数检验解析优秀PPT.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.4检验的实际意义及两类错误检验的实际意义及两类错误 检验方法的评价问题:按什么标准来提检验方法的评价问题:按什么标准来提出原假设出原假设?由于对于相应的问题检验方法不由于对于相应的问题检验方法不唯一唯一,最优的方法是什么最优的方法是什么?检验的优劣与显著检验的优劣与显著性水平性水平a a的关系如何的关系如何?以及结论的实际意义是以及结论的实际意义是什么什么?3.4.1 3.4.1 检验结果的实际意义检验结果的实际意义 (a)(a)检验的原理检验的原理“小概率事务在一次试验小概率事务在一次试验中不发生中不发生”。此结论只是在概率意义下成立,此结论只是在概率意义下成立,并不是严格成立的。并不是
2、严格成立的。如摸奖问题如摸奖问题(例例3.33.3,P72P72),因此当摸奖因此当摸奖人事实上的确未作弊时,商店的统计推断就人事实上的确未作弊时,商店的统计推断就犯了错误犯了错误,“,“小概率事务在一次试验中可能小概率事务在一次试验中可能发生发生”.”.1(b)原假设与备择假设的地位是不对称的原假设与备择假设的地位是不对称的,当当“小概率事务小概率事务”未发生时,就不能拒绝原假未发生时,就不能拒绝原假设设但不等于逻辑上证明白但不等于逻辑上证明白成立,只成立,只能说没有充分的证据拒绝。即能说没有充分的证据拒绝。即受爱护受爱护.l都成立。都成立。例例例例3.113.113.113.11 (P92
3、)设总体设总体XN(,1),又设又设X1,X2,.,Xn为为总体总体X 的样本的样本,样本均值样本均值=X1=0.5 ,样本容量,样本容量n n1 1,0.050.05,提出两种假设的方法,分别如下,提出两种假设的方法,分别如下:2l实际中,一般提出原假设要慎重,倾向于不实际中,一般提出原假设要慎重,倾向于不轻易否定,而受爱护的程度为轻易否定,而受爱护的程度为。其越小,小概。其越小,小概率事务就越难发生,率事务就越难发生,H0就越难被否定。就越难被否定。(c)从另一角度看,既然原假设从另一角度看,既然原假设H0受爱护,则对其受爱护,则对其的确定相对来说是缺乏劝服力的,反之对其的否定则的确定相对
4、来说是缺乏劝服力的,反之对其的否定则是有力的,且是有力的,且越小,小概率事务就越难发生,一旦越小,小概率事务就越难发生,一旦发生了,这种否定就越有力。发生了,这种否定就越有力。33.4.2检验中的两类错误所谓犯错误是指检验的结论与实际状况不符。两类错误:(1)H0成立,而检验结果表明其不成立“弃真”;(2)H0不成立,而检验结果表明其成立“取伪”。记记:=P第一类错误第一类错误=P拒绝拒绝H0|H0真真 =P其次类错误其次类错误=P接受接受H0|H0伪伪l检验的本质是构造否定域检验的本质是构造否定域V,在看样本点是否落入在看样本点是否落入V中。中。当然当然,我们希望犯两类错误的概率都尽可能的小
5、我们希望犯两类错误的概率都尽可能的小,最好最好都为零都为零.但当样本容量固定时但当样本容量固定时,是不行能的是不行能的.在实际问在实际问题中题中,通常的做法是通常的做法是:先限制犯第一类错误的概率先限制犯第一类错误的概率,即即依据实际状况依据实际状况,指定一个较小的数指定一个较小的数 (如如0.05,0.01等等),有了有了 的值的值,从而可确定拒绝域从而可确定拒绝域.4例例例例3.123.123.123.12 (P94)设总体设总体XN(,02),02已知,又设已知,又设X1,X2,.,Xn为总体为总体X 的样本的样本,x1,x2,xn为为X的一的一组样本观测值,试求组样本观测值,试求对问题
6、:对问题:的的 检验的两类错误的概率。检验的两类错误的概率。拒绝域拒绝域:单侧检验单侧检验53.4.3样本容量确定问题样本容量确定问题从例从例3.12看出,当样本容量固定时,若要限制第看出,当样本容量固定时,若要限制第一类错误的概率,就不能使其次类错误的概率随一类错误的概率,就不能使其次类错误的概率随意小。但从(意小。但从(3.10)式看出,固定)式看出,固定,使,使n增大,增大,可使可使随意小。随意小。但实际中,样本的采集是有成本的,或根本无法但实际中,样本的采集是有成本的,或根本无法获得大样本。获得大样本。引出问题:能否确定一个最小的引出问题:能否确定一个最小的n使得两类错误使得两类错误的
7、概率都在限制的范围。的概率都在限制的范围。6(一)正态总体正态总体,已知;已知;的的u检验。检验。当等式右端不是整数时当等式右端不是整数时,取不小于右端的最小的整数取不小于右端的最小的整数7(二)正态总体正态总体,未知,考虑未知,考虑的的检验。检验。隐式解隐式解,通过给定的通过给定的和和试算确定试算确定n.8例例例例3.13 3.13 3.13 3.13 一门炮需通过放射试验来进行精度验收,假设一门炮需通过放射试验来进行精度验收,假设一门炮需通过放射试验来进行精度验收,假设一门炮需通过放射试验来进行精度验收,假设命中误差是纯随机的,又横向(或纵向)误差容许的标命中误差是纯随机的,又横向(或纵向
8、)误差容许的标命中误差是纯随机的,又横向(或纵向)误差容许的标命中误差是纯随机的,又横向(或纵向)误差容许的标准差为准差为准差为准差为0000,制造方要求接受的检验方法要求保证:假如,制造方要求接受的检验方法要求保证:假如,制造方要求接受的检验方法要求保证:假如,制造方要求接受的检验方法要求保证:假如产品合格而被拒绝的概率不大于产品合格而被拒绝的概率不大于产品合格而被拒绝的概率不大于产品合格而被拒绝的概率不大于5 5 5 5;运用方要求保证,;运用方要求保证,;运用方要求保证,;运用方要求保证,若产品不合格且标准差超过若产品不合格且标准差超过若产品不合格且标准差超过若产品不合格且标准差超过20
9、202020而被接受的概率小于而被接受的概率小于而被接受的概率小于而被接受的概率小于10101010,试问至少应放射多少发炮弹进行试验,才能满足,试问至少应放射多少发炮弹进行试验,才能满足,试问至少应放射多少发炮弹进行试验,才能满足,试问至少应放射多少发炮弹进行试验,才能满足双方的要求。双方的要求。双方的要求。双方的要求。解:设炮弹落点的横向(或纵向)偏差听从正态分布,解:设炮弹落点的横向(或纵向)偏差听从正态分布,利用上式利用上式,通过给定的通过给定的=0.05和和=0.1,查表查表进行试算进行试算,最终确定最终确定n=37.9SPSS软件:参数件:参数检验之均之均值检验Means过程过程对
10、准备比较的各组计算描述指标,进对准备比较的各组计算描述指标,进行预分析,也可干脆比较。行预分析,也可干脆比较。One-SamplesTTest过程过程进行样本均数与已知总进行样本均数与已知总体均数的比较。体均数的比较。Independent-SamplesTTest过程过程进行两样本均进行两样本均数差别的比较,即通常所说的两组资料的数差别的比较,即通常所说的两组资料的t检验。检验。Paired-SamplesTTest过程过程进行配对资料的显进行配对资料的显著性检验,即配对著性检验,即配对t检验。检验。One-WayANOVA过程过程进行两组及多组样本均数进行两组及多组样本均数的比较,即成组设
11、计的方差分析,还可进行随后的比较,即成组设计的方差分析,还可进行随后的两两比较。的两两比较。10再通过转换:再通过转换:将将u通过转换为通过转换为y以后,留下以后,留下x和和y的刻度就是正态概率纸,是的刻度就是正态概率纸,是非匀整刻度。若是一般正态分布总体,则非匀整刻度。若是一般正态分布总体,则分布函数的图形分布函数的图形,在,在xu平面上是一条直线。即:平面上是一条直线。即:x=u+.不同表示斜率不同,不同表示斜率不同,不不同表示在同表示在x轴上的截距不同。轴上的截距不同。(二)检验方法二)检验方法若假设若假设H0为真,则在概率纸上的坐标点(为真,则在概率纸上的坐标点(xi,Fn(xi)(i
12、=1,2,m)在一条直线上。若在(近似)一条直线上,在一条直线上。若在(近似)一条直线上,就接受假设,否则拒绝。一般中间点靠近即可。就接受假设,否则拒绝。一般中间点靠近即可。113.5非参数假设检验非参数假设检验总体的分布类型不知道,仅知是连续或离散型总体的分布类型不知道,仅知是连续或离散型(一)正态概率纸的构造一)正态概率纸的构造 首先建立始终角坐标系,横轴上刻度为首先建立始终角坐标系,横轴上刻度为x x轴,纵轴,纵轴上刻度为轴上刻度为u u值,都为匀整刻度。其中:值,都为匀整刻度。其中:3.5.1正态概率纸检验正态概率纸检验工程上常用的简洁但粗糙方法工程上常用的简洁但粗糙方法,用以推断用以
13、推断是否是否正态分布以及相应的均值和方差估计。正态分布以及相应的均值和方差估计。非参数检验非参数检验随机变量之间的独立性检验随机变量之间的独立性检验总体分布函数的拟合检验总体分布函数的拟合检验12基本方法是首先将容量为n的样本从小到大排序得到,则样本的阅历分布函数可表示为当当时时,事实上取事实上取,相应的,相应的是是N(0,1)的的分位点,此时点分位点,此时点应当近似在直线应当近似在直线上。假如由样本计算出的上。假如由样本计算出的n个个点近似在直线上,则可认为它来自正态分布。点近似在直线上,则可认为它来自正态分布。一般地一般地,中间的点的位置离直线的偏差不能太大中间的点的位置离直线的偏差不能太
14、大,两头的两头的离直线位置的偏差可以大一些离直线位置的偏差可以大一些.否则拒绝原假设否则拒绝原假设.讲解讲解P99-101(例(例3.14)13表表3.3编号编号分组区间分组区间组中值组中值频数频数累积频数累积频数累积频率累积频率(%)1(-,198196.56652(198,201199.571310.833(201,204202.5142722.504(204,207205.5204739.175(207,210208.5237058.336(210,213211.5229276.667(213,216214.51410688.338(216,219217.58114959(219,+)2
15、20.56120100以分组区间的中点以分组区间的中点(组中值组中值)为横坐标为横坐标,累积频率为纵坐标累积频率为纵坐标,在正态概率纸上描出在正态概率纸上描出9个点个点(如图如图3-6,见书上,见书上P101)14由图形检验大致地推断出总体是听从正态分布后,由图形检验大致地推断出总体是听从正态分布后,由于由于由由与直线交点的横坐标即为与直线交点的横坐标即为;又由于又由于,则则与直线的交点的横坐标为与直线的交点的横坐标为得到得到。除此之外,还有对数正态概率纸,威布除此之外,还有对数正态概率纸,威布Weibull概率纸等来探讨相应的分布概率纸等来探讨相应的分布定性的方法。定性的方法。(三)未知参数
16、三)未知参数,2的估计的估计以下介绍数值检验方法(定量方法)以下介绍数值检验方法(定量方法)。15SPSS软件:非参数件:非参数检验之正之正态概率概率纸输入数据输入数据:确定变量确定变量,输入样本输入样本.若是分组资料,样本值输入组中值,再加权若是分组资料,样本值输入组中值,再加权(DATAWeighBy频数)频数)Q-Q图图一种正态概率纸一种正态概率纸,检验的吩咐在检验的吩咐在GRAPHS菜单菜单,由得到的图形是否为一条直由得到的图形是否为一条直线线,可以大致地推断总体是否听从正态分布。可以大致地推断总体是否听从正态分布。P99-101(例(例3.14)163.5.2皮尔逊皮尔逊拟合检验拟合
17、检验拟合检验拟合检验:H0 0:X的分布函数为的分布函数为F0(X)为理论分布,用其去拟合样本值。为理论分布,用其去拟合样本值。拟合优度:拟合好坏的标准拟合优度:拟合好坏的标准,即拟合的优良程度。即拟合的优良程度。设总体设总体X(一维或多维)的分布(一维或多维)的分布 完全已知或完全已知或分布中含有未知参数。分布中含有未知参数。为样本值。为样本值。一般原则一般原则:构造检验统计量:构造检验统计量(样本(样本X与总体分布与总体分布F0 0的偏差的度量)的偏差的度量)及界限及界限D0 。若若D超过了超过了D0 0,就否定,否则接受原假设。,就否定,否则接受原假设。对于对于D的不同定义可以得到不同的
18、检验方法的不同定义可以得到不同的检验方法。17(一)理论分布完全已知的状况(一)理论分布完全已知的状况1设总体设总体X是离散型,取有限值是离散型,取有限值理论分布律理论分布律F0:原假设原假设记记ni为为中等于中等于ai的个数,的个数,(ni称为称为ai的视察频数),的视察频数),Xa1a2akPp1p2pk18而而npi称作称作ai的的理论频数理论频数。当当X的分布为的分布为F0,由大数定理,由大数定理,H0成立时,成立时,与与 相差不大。相差不大。19001900年,皮尔逊建立了统计量年,皮尔逊建立了统计量 用来衡量理论分布用来衡量理论分布p1,p2,pk与实际数据的偏与实际数据的偏差差.
19、(相对差异的总和)。(相对差异的总和)。19得到了得到了:当当为真时,为真时,当当为假时,为假时,皮尔逊还证明白,皮尔逊还证明白,时,时,统计量的极统计量的极限分布为限分布为20因此,给定检验水平因此,给定检验水平上述检验问题的否定域为:上述检验问题的否定域为:(单侧检验问题)(单侧检验问题)此时,此时,时,时,皮尔逊皮尔逊检验法。检验法。讲解例讲解例3.15(P104)21Sig.P值值=0.05,接受接受H0SPSS输入变量值及频数输入变量值及频数,给变量加权给变量加权选选ANALYZE菜单非参数检验菜单非参数检验二项分布检验二项分布检验,输入检验参数值输入检验参数值.22(2)(2)为一
20、般(连续)的完全已知分布为一般(连续)的完全已知分布 化作离散型处理(设一维的状况)化作离散型处理(设一维的状况)选取常数选取常数 ,将将 分成分成k k个互不相交的区间,个互不相交的区间,记作记作 。记记 为为X X落入区间落入区间 的概率的概率.23记记为样本为样本落入区间落入区间的频数,理论的频数,理论频数为频数为。皮尔逊检验统计量为皮尔逊检验统计量为在在为真时,其极限分布为为真时,其极限分布为其余方法与前其余方法与前(1)相同。相同。24在很多实际问题中在很多实际问题中,理论分布类型已知理论分布类型已知,但其但其中含有若干未知参数中含有若干未知参数.如如:此时,检验此时,检验先求先求下
21、,未知参数的点估计下,未知参数的点估计(最大似然估计最大似然估计),记,记作,作,再计算再计算(二)理论分布带参数的状况(二)理论分布带参数的状况25用此代替前述的用此代替前述的,得到统计量为,得到统计量为Fisher证明白满足确定条件下的点估计,证明白满足确定条件下的点估计,其极限分布为其极限分布为于是,否定域为于是,否定域为具体过程见具体过程见P106,例,例3.16。26SPSS输入变量值及频数输入变量值及频数,给变量加权给变量加权,选选ANALYZE菜单菜单非参数检验中卡方检验非参数检验中卡方检验,输入检验参数值输入检验参数值(Pi).27(三)(三)方法用于检验独立性方法用于检验独立
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 检验 解析 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内