简单统计分析与过程.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《简单统计分析与过程.ppt》由会员分享,可在线阅读,更多相关《简单统计分析与过程.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于简单统计分析与过程现在学习的是第1页,共43页一、假设检验与一、假设检验与SAS过程过程平均每户消费支出500600700800900 1000家庭数8153025139例题例题6.1:为了了解农村居民家庭消费水平是否有所提高,2008年,某市对其农村居民家庭进行了一次抽样调查,其中100户被抽样家庭的调查结果如下表:表6.1 2008年某市农村居民家庭月均消费水平若3年前该市农村居民家庭月均消费支出服从N(720,17580),假定2008年月均消费支出服从正态分布,问该市农村居民家庭月均消费支出是否有显著提高?(显著性水平0.05)即在方差未知的情况下检验即在方差未知的情况下检验现在学
2、习的是第2页,共43页统计量的计算值、临界值、显著性水平及检验概率统计量的计算值、临界值、显著性水平及检验概率之间的关系之间的关系假定假定检验统计量检验统计量Z服从正态分布服从正态分布统计量的计算值:统计量的计算值:一次抽样观测值代入统计量一次抽样观测值代入统计量Z后得后得到的数值到的数值Z0.临界值:临界值:在给定的显著性水平下,由在给定的显著性水平下,由现在学习的是第3页,共43页统计量的计算值、临界值、显著性水平及检验概率之统计量的计算值、临界值、显著性水平及检验概率之间的关系间的关系检验概率检验概率:由临界值和检验概率的计算公式,可知由临界值和检验概率的计算公式,可知因此,判断接受或拒
3、绝因此,判断接受或拒绝H0只需看只需看p大于还是小于大于还是小于现在学习的是第4页,共43页单样本和两样本下的假设检验单样本和两样本下的假设检验单样本的假设检验单样本的假设检验(一)单样本的参数假设检验(正态分布总体)(一)单样本的参数假设检验(正态分布总体)总体均值的假设检验总体均值的假设检验检验统计量检验统计量:拒绝域:拒绝域:现在学习的是第5页,共43页检验统计量检验统计量:拒绝域:拒绝域:现在学习的是第6页,共43页对于总体均值的假设检验,可转化为均值是否为零的检验均值是否为零的检验,可通过PROC MEANS过程实现,只需在选项中选择t,prt,和clm,alpha。例6.1程序:d
4、ata consume;input expend number;dif=expend-720;cards;500 8 600 15 750 30 800 25 900 13 1000 9;proc means mean t prt;var dif;freq number;output out=meant t=tv;run;现在学习的是第7页,共43页由于检验变量由于检验变量dif=expend-720的的t值值=3.17,概率概率pr|t|的值为的值为0.0020,小于显著性水平,小于显著性水平0.05,故,故在在0.05的显著性水平下推断出的显著性水平下推断出dif的均值显著不为的均值显著不
5、为0,也即居民月,也即居民月均消费支出显著不等于均消费支出显著不等于720.现在学习的是第8页,共43页data a;set meant;k=_freq_-1;p=1-probt(tv,k);t1=tinv(0.95,k);proc print;run;p=1-probt(t,k)t1=tinv(0.95,k);计算计算t分布的分布的0.95分位数分位数显然,显然,tv的值的值t1且且p值也值也0.05,故在故在0.05的显著性水平下拒绝原假的显著性水平下拒绝原假设,也即接受居民月均消费支出显著大于设,也即接受居民月均消费支出显著大于720.现在学习的是第9页,共43页 总体方差的假设检验总体
6、方差的假设检验检验统计量:检验统计量:拒绝域:拒绝域:现在学习的是第10页,共43页例例6.2:检验例检验例6.1中居民消费支出的方差是否有变中居民消费支出的方差是否有变化,即是否仍为化,即是否仍为17580。proc means var;var expend;freq number;output out=test var=varex;run;data A(drop=_type_);set test;k=_freq_-1;chisq=k*varex/17580;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);proc print
7、 data=a noobs;run;现在学习的是第11页,共43页程序说明:程序说明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);chisq=k*varex/17580;p=1-probchi(chisq,k);分别计算分别计算分布的分布的0.025和和0.975分位数。分位数。由于由于 chisq统计量值满足统计量值满足ci1chisq0.05也表明,在也表明,在0.05的显著性水平下,的显著性水平下,接受原假设。接受原假设。现在学习的是第12页,共43页(二)单样本的非参数假设检验(二)单样本的非参数假设检验K.Pearson提出以下统计量:提出以下统计量:总体
8、分布的拟合优度检验总体分布的拟合优度检验拟合优度检验是根据样本的经验分布对总体分布作出的估拟合优度检验是根据样本的经验分布对总体分布作出的估计。计。拒绝域:现在学习的是第13页,共43页表表6.3 订单频数分布表订单频数分布表星期一星期一星期二星期二星期三星期三星期四星期四星期五星期五合计合计 7 1215111560问:该企业的订单在每星期问:该企业的订单在每星期5天中是否服从均匀分布?(显著性水平天中是否服从均匀分布?(显著性水平0.05)例例6.3 某企业欲了解其产品订单的分布情况,在随机选择某企业欲了解其产品订单的分布情况,在随机选择的一周中发现,其订单频数分布如下表:的一周中发现,其
9、订单频数分布如下表:现在学习的是第14页,共43页程序实现:程序实现:data chisq;input foi fei;dif=(foi-fei);div=dif*dif/fei;cards;7 12 12 12 15 12 11 12 15 12;proc means sum;var div;output out=test sum=chisq;run;data A;set test;k=_freq_-1;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);proc print data=a noobs;run;现在学习的是第15页
10、,共43页程序说明程序说明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);div=dif*dif/fei;proc means sum;var div;output out=test sum=chisq;p=1-probchi(chisq,k);分别计算分布的0.025和0.975分位数。现在学习的是第16页,共43页由于由于 chisq统计量值满足统计量值满足ci1chisq0.05也表明,在也表明,在0.05的显著性水平下,的显著性水平下,接受原假设。接受原假设。现在学习的是第17页,共43页 总体均值的非参数检验(总体不服从正态分布)总体均值的非参数检验(总体不
11、服从正态分布)利用利用UNIVARIATE过程中的符号检验与威尔克森秩和检验。过程中的符号检验与威尔克森秩和检验。data consume;input expend number;dif=expend-720;cards;500 8 600 15 750 30 800 25 900 13 1000 9;proc univariate alpha=0.1;var dif;freq number;run;现在学习的是第18页,共43页总体不服从正态分布,利用符号检验与威尔克森秩和检验总体不服从正态分布,利用符号检验与威尔克森秩和检验(符号秩检验)。(符号秩检验)。由于由于Pr=|M|的的P值小于值
12、小于0.0001,Pr=|S|的的P值为值为0.002,都小于给定的显著性水平,都小于给定的显著性水平,故拒绝原假设,认为故拒绝原假设,认为dif均值不为零,与即认为居民家庭月均消费均值不为零,与即认为居民家庭月均消费支出显著大于支出显著大于720.现在学习的是第19页,共43页两样本的假设检验两样本的假设检验(一)两独立组的假设检验(一)两独立组的假设检验独立组:两样本来自于两个独立总体独立组:两样本来自于两个独立总体样本需满足以下两个条件:正态性,方差齐次性。样本需满足以下两个条件:正态性,方差齐次性。检验统计量:检验统计量:拒绝域拒绝域检验可通过检验可通过Proc ttest实现实现现在
13、学习的是第20页,共43页 满足正态性而不满足方差齐次性时,采用参数的近满足正态性而不满足方差齐次性时,采用参数的近似似T检验或非参数的威尔克森秩和检验检验或非参数的威尔克森秩和检验。两个条件都不满足时,采用非参数的威尔克森秩和检验。两个条件都不满足时,采用非参数的威尔克森秩和检验。(proc nparlway wilcoxon;);)现在学习的是第21页,共43页满足正态分布条件满足正态分布条件表表6.4 地区地区A和和B家庭平均收入水平情况家庭平均收入水平情况A地地区区2.52.93.25.33.84.24.03.93.33.14.54.74.25.75.13.04.92.73.84.6B
14、地地区区3.74.14.33.63.93.84.74.45.35.1 3.83.76.05.52.93.45.23.84.84.6问:这两个地区的家庭平均收入是否有显著差异?(显著性水平问:这两个地区的家庭平均收入是否有显著差异?(显著性水平0.05)例例6.4:某银行考虑在两个相邻地区某银行考虑在两个相邻地区A和和B之间开设一个新之间开设一个新的营业网点。银行所关心的时这两个地区家庭平均收入是否的营业网点。银行所关心的时这两个地区家庭平均收入是否相同。为此,在这两个地区分别抽取了相同。为此,在这两个地区分别抽取了20户居民家庭进行调查,户居民家庭进行调查,调查结果如下表:调查结果如下表:现在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 统计分析 过程
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内