(07)第7章 分类变量的推断(2011年).ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《(07)第7章 分类变量的推断(2011年).ppt》由会员分享,可在线阅读,更多相关《(07)第7章 分类变量的推断(2011年).ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析数据分析(方法与案例方法与案例)作者作者 贾俊平贾俊平统计学统计学统统 计计 学学*7-2统计学统计学STATISTICS(第四版第四版)我们是无知的,所以让我们学习吧!Karl Pearson统计名言统计名言*第第 7 章章 分类变量的推断分类变量的推断7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验 7.2 两个分类变量的独立性检验两个分类变量的独立性检验 7.3 两个分类变量的相关性度量两个分类变量的相关性度量*7-4统计学统计学STATISTICS(第四版第四版)学习目标学习目标l一个分类变量的拟合优度检验一个分类变量的拟合优度检验l两个分类变量的独立性检验两个分类
2、变量的独立性检验l应用应用 2检验应注意的问题检验应注意的问题l两个分类变量的相关性度量两个分类变量的相关性度量 l用用SPSS进行进行 2检验检验*7-5统计学统计学STATISTICS(第四版第四版)性别与是否逃课有关系吗?性别与是否逃课有关系吗?读读完完四四年年大大学学,一一次次课课也也没没有有逃逃过过,这这样样的的学学生生恐恐怕不多怕不多20042004年年5 5月月,中中国国人人民民大大学学财财政政金金融融学学院院的的3 3名名学学生生就就逃逃课课问问题题做做了了一一次次调调查查。调调查查的的对对象象是是财财政政金金融融学学院院的的大大一一,大大二二,大大三三本本科科生生。样样本本的
3、的抽抽取取方方式式是是分分层层抽抽样样与与简简单单随随机机抽抽样样结结合合,先先根根据据年年级级划划分分层层次次,然然后后对对各各个个班班级级简简单单随随机机抽抽样样,共共抽抽取取150150名名学学生生组组成成一一个个样样本本,并并对对每每个个学学生生采采用用问问卷卷调调查查。问问卷卷内内容容包包括括每每周周逃逃课课次次数数、所所逃逃课课程程的的类类型型(选选修修课课、专专业业课课等等等等)和和逃逃课课原原因因等等。调调查查得得到到的的男男女女学学生逃课情况的汇总表如下生逃课情况的汇总表如下*7-6统计学统计学STATISTICS(第四版第四版)性别与是否逃课有关系吗?性别与是否逃课有关系吗
4、?这这里里涉涉及及到到两两个个分分类类变变量量,一一个个是是逃逃课课情情况况,一一个个是是性别性别根根据据上上面面的的数数据据,你你认认为为性性别别与与逃逃课课与与否否有有关关系系吗吗?如何来检验两个分类变量之间是否存在关系呢?如何来检验两个分类变量之间是否存在关系呢?学完本章内容就很容易解决这样的问题学完本章内容就很容易解决这样的问题*7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验 7.1.1 期望频数相等期望频数相等 7.1.2 期望频数不等期望频数不等 第第 7 章章 分类变量的推断分类变量的推断*7-8统计学统计学STATISTICS(第四版第四版)1.利利用用Pears
5、on-Pearson-2 2统统计计量量来来判判断断某某个个分分类类变变量量各各类类别别的的观观察察频频数数分分布布与与某某一一理理论论分分布布或或期期望望分分布是否一致的检验方法布是否一致的检验方法n n比如,各月份的产品销售量是否符合均匀分布比如,各月份的产品销售量是否符合均匀分布n n不同地区的离婚率是否有显著差异不同地区的离婚率是否有显著差异2.也称为也称为一致性检验一致性检验一致性检验一致性检验(test of homogeneity)(test of homogeneity)3.该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等 什么是拟合优度检验什么是拟合优度检验
6、?(goodness of fit test)*7.1.1 期望频数相等期望频数相等7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验*7-10统计学统计学STATISTICS(第四版第四版)【例例例例7-17-1】为为研研究究消消费费者者对对不不同同品品牌牌的的牛牛奶奶是是否否有有明明显显偏偏好好,一一家家调调查查公公司司抽抽样样调调查查了了500500个个消消费费者者对对4 4个个品品牌牌的的偏偏好好情情况况,得得到到的的结结果果如如下下表表所所示示。检检验验消消费费者者对对牛牛奶奶品品牌牌的的偏偏好好是是否否有有显著差异显著差异(=0.05=0.05)拟合优度检验拟合优度检验(
7、期望频数相等期望频数相等)*7-11统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望频数相等)第第1步:步:提出假设 H0:观察频数与期望频数无显著差 异(无明显偏好)H1:观察频数与期望频数有显著差 异(有明显偏好)第第2步:步:计算2统计量自由度自由度自由度自由度df=df=类别个数类别个数类别个数类别个数-1-1*7-12统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望频数相等)2 统计量计算表统计量计算表*7-13统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望
8、频数相等)第第3步:步:做出决策 由 于 自 由 度=4-1=3,利 用 Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为6.22366E-12,由于P值接近于0。拒绝原假设,表明消费者对牛奶品牌的偏好有显著差异*7-14统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS期望频数相等期望频数相等)第第第第1 1步:步:步:步:先指定先指定“频数频数”变量变量 点击点击【DataData】【WeightWeight-Cases-Cases】,选择,选择 【Weight cases byWeight cases by】,将将“频数频数”(本
9、例为人数本例为人数)选入选入【Frequency VariableFrequency Variable】,点击,点击【OKOK】第第第第2 2步:步:步:步:选择菜单:选择菜单:【AnalyzeAnalyze】【NonparametricNonparametric TestTest】【ChiChi Square Square】,进入主对话框,进入主对话框 第第第第3 3步:步:步:步:将频数变量选入将频数变量选入(本例为人数本例为人数)【Test Variable Test Variable List List】。点击。点击【OKOK】用用用用SPSSSPSS进行检验进行检验进行检验进行检验*
10、7-15统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS)近近似似的的显显著著性性水水平平(AsympAsymp.Sig.)Sig.)即即 为为 P P值值。由由 于于 P P值值 接接 近近 于于 0 0。拒拒绝绝原原假假设设,表表明明消消费费者者对对牛牛奶奶品品牌牌的的偏偏好好有显著差异有显著差异*7.1.2 期望频数不等期望频数不等7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验*7-17统计学统计学STATISTICS(第四版第四版)【例例例例7-27-2】一一项项针针对对全全国国的的房房地地产产价价格格调调查查表表明明,城城镇镇居
11、居民民对对房房价价表表示示非非常常不不满满意意的的占占15%15%,不不满满意意的的占占45%45%,一一般般的的占占25%25%,满满意意的的占占9%9%,非非常常满满意意的的占占6%6%。为为研研究究一一线线大大城城市市的的居居民民对对房房地地产产价价格格的的满满意意程程度度,一一家家研研究究机机构构在在某某城城市市抽抽样样调调查查300300人人,其其中中的的一一个个问问题题是是:“您您对对目目前前的的住住房房价价格格是是否否满满意意?”调调查查共共设设非非常常不不满满意意、不不满满意意、一一般般、满满意意、非非常常满满意意5 5个个选选项项。调调查查结结果果的的频频数数分分布布如如下下
12、表表所所示示。检检验验该该城城市市居居民民对对房房屋屋价价格格满满意意度度评评价价的的频频数数与与全全国国的的调调查查频频数数是是否一致否一致 拟合优度检验拟合优度检验(期望频数不等期望频数不等)*7-18统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)第第第第1 1步:步:步:步:提出假设提出假设 H H0 0:该城市居民对房屋价格的评价频数与全:该城市居民对房屋价格的评价频数与全 国的评价频数无显著差异国的评价频数无显著差异 H H1 1 :该城市居民对房屋价格的评价频数与全:该城市居民对房屋价格的评价频数与全 国的评价频数有显著差异国的
13、评价频数有显著差异第第第第2 2步:步:步:步:计算期望频数和计算期望频数和 2 2统计量统计量自由度自由度自由度自由度df=df=类别个数类别个数类别个数类别个数-1-1*7-19统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)期望频数计算表期望频数计算表*7-20统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)2 统计量计算表统计量计算表*7-21统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)第第3步:步:做出决策 由 于 自 由 度
14、=5-1=4,利 用 Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为0.102662,由于P0.05。不拒绝原假设,没有证据表明该城市居民对房屋价格满意度的评价与全国有显著差异*7-22统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS期望频数不等期望频数不等)第第第第1 1步:步:步:步:先指定先指定“频数频数”变量变量第第第第2 2步:步:步:步:选择菜单:选择菜单:【AnalyzeAnalyze】【NonparametricNonparametric TestTest】【ChiChi Square Square】,进入主对话框,
15、进入主对话框第第第第3 3步:步:步:步:将频数变量选入将频数变量选入【Test Variable ListTest Variable List】第第第第4 4步:步:步:步:在在【Expected ValuesExpected Values】下选择下选择【ValuesValues】,并并将将相相应应的的期期望望比比例例(本本例例为为全全国国的的调调查查比比例例)依次输入到框内并点击依次输入到框内并点击【AddAdd】(每次只能输每次只能输 入入1 1个,并点击个,并点击【AddAdd】,然后在输入另一,然后在输入另一 个,再点击个,再点击【AddAdd】)。点击。点击【OKOK】用用用用SP
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 07第7章 分类变量的推断2011年 07 分类 变量 推断 2011
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内