简单统计分析和过程.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《简单统计分析和过程.ppt》由会员分享,可在线阅读,更多相关《简单统计分析和过程.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于简单统计分析与过程第一张,PPT共四十三页,创作于2022年6月一、假设检验与一、假设检验与SAS过程过程平均每户消费支出500600700800900 1000家庭数8153025139例题例题6.1:为了了解农村居民家庭消费水平是否有所提高,2008年,某市对其农村居民家庭进行了一次抽样调查,其中100户被抽样家庭的调查结果如下表:表6.1 2008年某市农村居民家庭月均消费水平若3年前该市农村居民家庭月均消费支出服从N(720,17580),假定2008年月均消费支出服从正态分布,问该市农村居民家庭月均消费支出是否有显著提高?(显著性水平0.05)即在方差未知的情况下检验即在方差未知
2、的情况下检验第二张,PPT共四十三页,创作于2022年6月统计量的计算值、临界值、显著性水平及检验概率统计量的计算值、临界值、显著性水平及检验概率之间的关系之间的关系假定假定检验统计量检验统计量Z服从正态分布服从正态分布统计量的计算值:统计量的计算值:一次抽样观测值代入统计量一次抽样观测值代入统计量Z后得到后得到的数值的数值Z0.临界值:临界值:在给定的显著性水平下,由在给定的显著性水平下,由第三张,PPT共四十三页,创作于2022年6月统计量的计算值、临界值、显著性水平及检验概率统计量的计算值、临界值、显著性水平及检验概率之间的关系之间的关系检验概率检验概率:由临界值和检验概率的计算公式,可
3、知由临界值和检验概率的计算公式,可知因此,判断接受或拒绝因此,判断接受或拒绝H0只需看只需看p大于还是小于大于还是小于第四张,PPT共四十三页,创作于2022年6月单样本和两样本下的假设检验单样本和两样本下的假设检验单样本的假设检验单样本的假设检验(一)单样本的参数假设检验(正态分布总体)(一)单样本的参数假设检验(正态分布总体)总体均值的假设检验总体均值的假设检验检验统计量检验统计量:拒绝域:拒绝域:第五张,PPT共四十三页,创作于2022年6月检验统计量检验统计量:拒绝域:拒绝域:第六张,PPT共四十三页,创作于2022年6月对于总体均值的假设检验,可转化为均值是否为零的均值是否为零的检验
4、检验,可通过PROC MEANS过程实现,只需在选项中选择t,prt,和clm,alpha。例6.1程序:data consume;input expend number;dif=expend-720;cards;500 8 600 15 750 30 800 25 900 13 1000 9;proc means mean t prt;var dif;freq number;output out=meant t=tv;run;第七张,PPT共四十三页,创作于2022年6月由于检验变量由于检验变量dif=expend-720的的t值值=3.17,概率概率pr|t|的值为的值为0.0020,小于
5、显著性水平,小于显著性水平0.05,故,故在在0.05的显著性水平下推断出的显著性水平下推断出dif的均值显著不为的均值显著不为0,也即居民月,也即居民月均消费支出显著不等于均消费支出显著不等于720.第八张,PPT共四十三页,创作于2022年6月data a;set meant;k=_freq_-1;p=1-probt(tv,k);t1=tinv(0.95,k);proc print;run;p=1-probt(t,k)t1=tinv(0.95,k);计算计算t分布的分布的0.95分位数分位数显然,显然,tv的值的值t1且且p值也值也0.05,故在故在0.05的显著性水平下拒绝原假的显著性水
6、平下拒绝原假设,也即接受居民月均消费支出显著大于设,也即接受居民月均消费支出显著大于720.第九张,PPT共四十三页,创作于2022年6月 总体方差的假设检验总体方差的假设检验检验统计量:检验统计量:拒绝域:拒绝域:第十张,PPT共四十三页,创作于2022年6月例例6.2:检验例检验例6.1中居民消费支出的方差是否有变中居民消费支出的方差是否有变化,即是否仍为化,即是否仍为17580。proc means var;var expend;freq number;output out=test var=varex;run;data A(drop=_type_);set test;k=_freq_-
7、1;chisq=k*varex/17580;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);proc print data=a noobs;run;第十一张,PPT共四十三页,创作于2022年6月程序说明:程序说明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);chisq=k*varex/17580;p=1-probchi(chisq,k);分别计算分别计算分布的分布的0.025和和0.975分位数。分位数。由于由于 chisq统计量值满足统计量值满足ci1chisq0.05也表明,在也表明,在0.05
8、的显著性水平下,的显著性水平下,接受原假设。接受原假设。第十二张,PPT共四十三页,创作于2022年6月(二)单样本的非参数假设检验(二)单样本的非参数假设检验K.Pearson提出以下统计量:提出以下统计量:总体分布的拟合优度检验总体分布的拟合优度检验拟合优度检验是根据样本的经验分布对总体分布作出的估拟合优度检验是根据样本的经验分布对总体分布作出的估计。计。拒绝域:第十三张,PPT共四十三页,创作于2022年6月表表6.3 订单频数分布表订单频数分布表星期一星期一星期二星期二星期三星期三星期四星期四星期五星期五合计合计 7 1215111560问:该企业的订单在每星期问:该企业的订单在每星期
9、5天中是否服从均匀分布?(显著性水平天中是否服从均匀分布?(显著性水平0.05)例例6.3 某企业欲了解其产品订单的分布情况,在随机选择某企业欲了解其产品订单的分布情况,在随机选择的一周中发现,其订单频数分布如下表:的一周中发现,其订单频数分布如下表:第十四张,PPT共四十三页,创作于2022年6月程序实现:程序实现:data chisq;input foi fei;dif=(foi-fei);div=dif*dif/fei;cards;7 12 12 12 15 12 11 12 15 12;proc means sum;var div;output out=test sum=chisq;r
10、un;data A;set test;k=_freq_-1;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);proc print data=a noobs;run;第十五张,PPT共四十三页,创作于2022年6月程序说明程序说明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);div=dif*dif/fei;proc means sum;var div;output out=test sum=chisq;p=1-probchi(chisq,k);分别计算分布的0.025和0.975分位数。第十六张,PPT
11、共四十三页,创作于2022年6月由于由于 chisq统计量值满足统计量值满足ci1chisq0.05也表明,在也表明,在0.05的显著性水平下,的显著性水平下,接受原假设。接受原假设。第十七张,PPT共四十三页,创作于2022年6月 总体均值的非参数检验(总体不服从正态分布)总体均值的非参数检验(总体不服从正态分布)利用利用UNIVARIATE过程中的符号检验与威尔克森秩和检验。过程中的符号检验与威尔克森秩和检验。data consume;input expend number;dif=expend-720;cards;500 8 600 15 750 30 800 25 900 13 100
12、0 9;proc univariate alpha=0.1;var dif;freq number;run;第十八张,PPT共四十三页,创作于2022年6月总体不服从正态分布,利用符号检验与威尔克森秩和检验总体不服从正态分布,利用符号检验与威尔克森秩和检验(符号秩检验)。(符号秩检验)。由于由于Pr=|M|的的P值小于值小于0.0001,Pr=|S|的的P值为值为0.002,都小于给定的显著性水平,都小于给定的显著性水平,故拒绝原假设,认为故拒绝原假设,认为dif均值不为零,与即认为居民家庭月均消费均值不为零,与即认为居民家庭月均消费支出显著大于支出显著大于720.第十九张,PPT共四十三页,
13、创作于2022年6月两样本的假设检验两样本的假设检验(一)两独立组的假设检验(一)两独立组的假设检验独立组:两样本来自于两个独立总体独立组:两样本来自于两个独立总体样本需满足以下两个条件:正态性,方差齐次性。样本需满足以下两个条件:正态性,方差齐次性。检验统计量:检验统计量:拒绝域拒绝域检验可通过检验可通过Proc ttest实现实现第二十张,PPT共四十三页,创作于2022年6月 满足正态性而不满足方差齐次性时,采用参数的满足正态性而不满足方差齐次性时,采用参数的近似近似T检验或非参数的威尔克森秩和检验检验或非参数的威尔克森秩和检验。两个条件都不满足时,采用非参数的威尔克森秩和检两个条件都不
14、满足时,采用非参数的威尔克森秩和检验。(验。(proc nparlway wilcoxon;);)第二十一张,PPT共四十三页,创作于2022年6月满足正态分布条件满足正态分布条件表表6.4 地区地区A和和B家庭平均收入水平情况家庭平均收入水平情况A地地区区2.52.93.25.33.84.24.03.93.33.14.54.74.25.75.13.04.92.73.84.6B地地区区3.74.14.33.63.93.84.74.45.35.1 3.83.76.05.52.93.45.23.84.84.6问:这两个地区的家庭平均收入是否有显著差异?(显著性水平问:这两个地区的家庭平均收入是否有
15、显著差异?(显著性水平0.05)例例6.4:某银行考虑在两个相邻地区某银行考虑在两个相邻地区A和和B之间开设一个新的之间开设一个新的营业网点。银行所关心的时这两个地区家庭平均收入是否相营业网点。银行所关心的时这两个地区家庭平均收入是否相同。为此,在这两个地区分别抽取了同。为此,在这两个地区分别抽取了20户居民家庭进行调查,户居民家庭进行调查,调查结果如下表:调查结果如下表:第二十二张,PPT共四十三页,创作于2022年6月data income;input area$income;cards;A 2.5 B 3.7 A 3.2 B 4.3 A 3.8 B 3.9 A 4.0 B 4.7 A 3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 统计分析 过程
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内