统计建模与R软件第五讲-(2017).pptx
《统计建模与R软件第五讲-(2017).pptx》由会员分享,可在线阅读,更多相关《统计建模与R软件第五讲-(2017).pptx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主要内容5.1 假设检验的基本概念5.2 重要的参数检验5.3 若干重要的非参数检验第1页/共30页定义5.1对假设检验问题,设x1 xn 为样本,W为样本空间中的一个子集,对于给定的(0,1),若W满足:则称由W构成(H0的)拒绝域的检验方法为显著性水平的检验。5.1 5.1 基本概念注解基本概念注解WS1S2+=第2页/共30页假设检验的两类错误:第一类型错误:否定了真实的原假设。(弃真)犯第一类型错误的概率为显著性水平,即:犯第一类型错误的概率可以通过显著性水平来控制。第二类型错误:接受了错误的原假设。(取伪)犯第二类型错误的概率常用表示,即:第3页/共30页犯错误的概率的计算是比较复杂
2、的,以正态分布为例,H0:=0,但是实际上H0为伪,即:!=0,=1.在H0 假设下,我们可以在总体均值为H0和H1两种情况下,分别作出两条正态分布曲线(A线和B线),见图1。在理论上存在的若干个样本均值中,只要某个样本 均值XiX B/2时,我们将误认为H0为真,也就是不拒绝H0。由于真实情况是H1为真(H0为假),这样我们就犯了错误,即纳伪的错误。犯错误的概率大小就是相对真实情况H1(正态曲线A)而言,图1中阴影部分的面积:=(ZX B1-/2)-(ZXB/2)(ZX B1-/2,ZXB/2 分别是H0假设下的分位点)X B1-/2(H0)(H1)真实的情况:关于取伪:X B/2第4页/共
3、30页4.功效和样本量:功效就是正确地否定了错误的原假设的概率,常用表示:功效可以告诉我们,在备择假设是真时(应该否定H0)时,我们可以否定H0 的可信程度.若功效太低,即使真实的与0之间有差异,也很难被所用的检验方法发现.而不充分的样本量总是造成检验的低功效.已知方差时正态分布均值的单样本z检验的功效:H H0 01-a1-a 0 0+1-H H1 1单侧备择单侧备择:第5页/共30页双侧备择=影响功效的因素:变小,则z减小,所以功效也减小;若备择均值远离无效均值(即|0-1|增加),则功效增加;增加,功效减小;样本量n增加,功效增加;和 1固定,样本量n多大才能达到希望的功效?在单侧检验:
4、双侧备择下的样本量:第6页/共30页2.使用power.t.test()函数power.t.test(n=NULL,delta=NULL,sd=1,sig.level=0.05,power=NULL,type=c(two.sample,one.sample,paired),alternative=c(two.sided,one.sided),strict=FALSE)ArgumentsnNumber of observations(per group)deltaTrue difference in meanssdStandard deviationsig.levelSignificance l
5、evel(Type I error probability)powerPower of test(1 minus Type II error probability)typeType of t testalternative One-or two-sided teststrictUse strict interpretation in two-sided casePower calculations for one and two sample t testsUsage 第7页/共30页例子:power.t.test(n=20,delta=1)#已知样本量,求功效power.t.test(po
6、wer=.90,delta=1)#已知功效,求样本量 Two-sample t test power calculation n=20 delta=1 sd=1 sig.level=0.05 power=0.8689528 alternative=two.sided NOTE:n is number in*each*group Two-sample t test power calculation n=22.02110 delta=1 sd=1 sig.level=0.05 power=0.9 alternative=two.sided NOTE:n is number in*each*gro
7、up 第8页/共30页5.2.1正态总体的假设检验一个正态总体的情况双边单边 已知时:未知时:拒绝域:拒绝域:已知时:未知时:拒绝域:拒绝域:第9页/共30页R实现P_value-function(cdf,x,paramet=numeric(0),side=0)n-length(paramet)#得到参数个数 P-switch(n+1,cdf(x),cdf(x,paramet),cdf(x,paramet1,paramet2),cdf(x,paramet1,paramet2,paramet3)if(side0)1-P else if(P1/2)2*P else 2*(1-P)#根据参数的个数计
8、算#左侧检验:=P(下分位点)#右侧检验:=1-P(上分位点)#双侧检验:=2P 与与比较,如果比较,如果 ,则拒绝则拒绝H0H H0 0 0P P第10页/共30页mean.test1:mean.test1-function(x,mu=0,sigma=-1,side=0)source(P_value.R)n-length(x);xb=0)z-(xb-mu)/(sigma/sqrt(n)P-P_value(pnorm,z,side=side)data.frame(mean=xb,df=n,Z=z,P_value=P)else t-(xb-mu)/(sd(x)/sqrt(n)P P 值,则在显著
9、性水平下拒绝原假设.如果 P 值,则在显著性水平下接受原假设.第11页/共30页例5.2:某种元件的寿命X(以h计)服从正态分布N(,2),其中,2未知,现测得16只元件的寿命如下:159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于225?x=c(159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170)source(mean.test1.R)mean.test1(x,mu=225,side=1)mean df T
10、P_value1 241.5 15 0.6685177 0.2569801t.test(x,alternative=greater,mu=225)One Sample t-testdata:x t=0.6685,df=15,p-value=0.257alternative hypothesis:true mean is greater than 225 95 percent confidence interval:198.2321 Inf sample estimates:mean of x 241.5 side=-10.05,平均寿命不大于(小于)225p-value=0.743020.05
11、,平均寿命不小于(大于)225是否有理由认为元件的平均寿命小于225?平均寿命小于225是小概率事件拒绝域比显著性水平小问题重点:第12页/共30页二个正态总体的情况 已知时:拒绝域:单边II:双边:单边I:未知时:未知时:单边II:双边:单边I:拒绝域:单边II:双边:单边I:拒绝域:单边II:双边:单边I:第13页/共30页R实现:mean.test2-function(x,y,sigma=c(-1,-1),var.equal=FALSE,side=0)source(P_value.R)n1-length(x);n2-length(y)xb-mean(x);yb=0)z-(xb-yb)/s
12、qrt(sigma12/n1+sigma22/n2)P-P_value(pnorm,z,side=side)data.frame(mean=xb-yb,df=n1+n2,Z=z,P_value=P)else if(var.equal=TRUE)Sw-sqrt(n1-1)*var(x)+(n2-1)*var(y)/(n1+n2-2)t-(xb-yb)/(Sw*sqrt(1/n1+1/n2)nu-n1+n2-2 else S1-var(x);S2-var(y)nu-(S1/n1+S2/n2)2/(S12/n12/(n1-1)+S22/n22/(n2-1)t-(xb-yb)/sqrt(S1/n1+S
13、2/n2)P-P_value(pt,t,paramet=nu,side=side)data.frame(mean=xb-yb,df=nu,T=t,P_value=P)已知时 未知时 未知时#P-value#P-value第14页/共30页例5.3在平炉上进行一项实验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一个平炉上进行的,每练一炉钢时除操作方法外,其他条件都尽可能做到相同。先用标准方法练一炉,然后用新方法练一炉,以后交替进行,各练了10炉,其得率分别为:标准方法78.172.476.274.377.478.476.075.576.777.3新方法79.181.077.379.18
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 建模 软件 第五 2017
限制150内