欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    (07)第7章 分类变量的推断(2011年).ppt

    • 资源ID:68701223       资源大小:320.51KB        全文页数:44页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    (07)第7章 分类变量的推断(2011年).ppt

    数据分析数据分析(方法与案例方法与案例)作者作者 贾俊平贾俊平统计学统计学统统 计计 学学*7-2统计学统计学STATISTICS(第四版第四版)我们是无知的,所以让我们学习吧!Karl Pearson统计名言统计名言*第第 7 章章 分类变量的推断分类变量的推断7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验 7.2 两个分类变量的独立性检验两个分类变量的独立性检验 7.3 两个分类变量的相关性度量两个分类变量的相关性度量*7-4统计学统计学STATISTICS(第四版第四版)学习目标学习目标l一个分类变量的拟合优度检验一个分类变量的拟合优度检验l两个分类变量的独立性检验两个分类变量的独立性检验l应用应用 2检验应注意的问题检验应注意的问题l两个分类变量的相关性度量两个分类变量的相关性度量 l用用SPSS进行进行 2检验检验*7-5统计学统计学STATISTICS(第四版第四版)性别与是否逃课有关系吗?性别与是否逃课有关系吗?读读完完四四年年大大学学,一一次次课课也也没没有有逃逃过过,这这样样的的学学生生恐恐怕不多怕不多20042004年年5 5月月,中中国国人人民民大大学学财财政政金金融融学学院院的的3 3名名学学生生就就逃逃课课问问题题做做了了一一次次调调查查。调调查查的的对对象象是是财财政政金金融融学学院院的的大大一一,大大二二,大大三三本本科科生生。样样本本的的抽抽取取方方式式是是分分层层抽抽样样与与简简单单随随机机抽抽样样结结合合,先先根根据据年年级级划划分分层层次次,然然后后对对各各个个班班级级简简单单随随机机抽抽样样,共共抽抽取取150150名名学学生生组组成成一一个个样样本本,并并对对每每个个学学生生采采用用问问卷卷调调查查。问问卷卷内内容容包包括括每每周周逃逃课课次次数数、所所逃逃课课程程的的类类型型(选选修修课课、专专业业课课等等等等)和和逃逃课课原原因因等等。调调查查得得到到的的男男女女学学生逃课情况的汇总表如下生逃课情况的汇总表如下*7-6统计学统计学STATISTICS(第四版第四版)性别与是否逃课有关系吗?性别与是否逃课有关系吗?这这里里涉涉及及到到两两个个分分类类变变量量,一一个个是是逃逃课课情情况况,一一个个是是性别性别根根据据上上面面的的数数据据,你你认认为为性性别别与与逃逃课课与与否否有有关关系系吗吗?如何来检验两个分类变量之间是否存在关系呢?如何来检验两个分类变量之间是否存在关系呢?学完本章内容就很容易解决这样的问题学完本章内容就很容易解决这样的问题*7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验 7.1.1 期望频数相等期望频数相等 7.1.2 期望频数不等期望频数不等 第第 7 章章 分类变量的推断分类变量的推断*7-8统计学统计学STATISTICS(第四版第四版)1.利利用用Pearson-Pearson-2 2统统计计量量来来判判断断某某个个分分类类变变量量各各类类别别的的观观察察频频数数分分布布与与某某一一理理论论分分布布或或期期望望分分布是否一致的检验方法布是否一致的检验方法n n比如,各月份的产品销售量是否符合均匀分布比如,各月份的产品销售量是否符合均匀分布n n不同地区的离婚率是否有显著差异不同地区的离婚率是否有显著差异2.也称为也称为一致性检验一致性检验一致性检验一致性检验(test of homogeneity)(test of homogeneity)3.该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等 什么是拟合优度检验什么是拟合优度检验?(goodness of fit test)*7.1.1 期望频数相等期望频数相等7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验*7-10统计学统计学STATISTICS(第四版第四版)【例例例例7-17-1】为为研研究究消消费费者者对对不不同同品品牌牌的的牛牛奶奶是是否否有有明明显显偏偏好好,一一家家调调查查公公司司抽抽样样调调查查了了500500个个消消费费者者对对4 4个个品品牌牌的的偏偏好好情情况况,得得到到的的结结果果如如下下表表所所示示。检检验验消消费费者者对对牛牛奶奶品品牌牌的的偏偏好好是是否否有有显著差异显著差异(=0.05=0.05)拟合优度检验拟合优度检验(期望频数相等期望频数相等)*7-11统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望频数相等)第第1步:步:提出假设 H0:观察频数与期望频数无显著差 异(无明显偏好)H1:观察频数与期望频数有显著差 异(有明显偏好)第第2步:步:计算2统计量自由度自由度自由度自由度df=df=类别个数类别个数类别个数类别个数-1-1*7-12统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望频数相等)2 统计量计算表统计量计算表*7-13统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数相等期望频数相等)第第3步:步:做出决策 由 于 自 由 度=4-1=3,利 用 Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为6.22366E-12,由于P值接近于0。拒绝原假设,表明消费者对牛奶品牌的偏好有显著差异*7-14统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS期望频数相等期望频数相等)第第第第1 1步:步:步:步:先指定先指定“频数频数”变量变量 点击点击【DataData】【WeightWeight-Cases-Cases】,选择,选择 【Weight cases byWeight cases by】,将将“频数频数”(本例为人数本例为人数)选入选入【Frequency VariableFrequency Variable】,点击,点击【OKOK】第第第第2 2步:步:步:步:选择菜单:选择菜单:【AnalyzeAnalyze】【NonparametricNonparametric TestTest】【ChiChi Square Square】,进入主对话框,进入主对话框 第第第第3 3步:步:步:步:将频数变量选入将频数变量选入(本例为人数本例为人数)【Test Variable Test Variable List List】。点击。点击【OKOK】用用用用SPSSSPSS进行检验进行检验进行检验进行检验*7-15统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS)近近似似的的显显著著性性水水平平(AsympAsymp.Sig.)Sig.)即即 为为 P P值值。由由 于于 P P值值 接接 近近 于于 0 0。拒拒绝绝原原假假设设,表表明明消消费费者者对对牛牛奶奶品品牌牌的的偏偏好好有显著差异有显著差异*7.1.2 期望频数不等期望频数不等7.1 一个分类变量的拟合优度检验一个分类变量的拟合优度检验*7-17统计学统计学STATISTICS(第四版第四版)【例例例例7-27-2】一一项项针针对对全全国国的的房房地地产产价价格格调调查查表表明明,城城镇镇居居民民对对房房价价表表示示非非常常不不满满意意的的占占15%15%,不不满满意意的的占占45%45%,一一般般的的占占25%25%,满满意意的的占占9%9%,非非常常满满意意的的占占6%6%。为为研研究究一一线线大大城城市市的的居居民民对对房房地地产产价价格格的的满满意意程程度度,一一家家研研究究机机构构在在某某城城市市抽抽样样调调查查300300人人,其其中中的的一一个个问问题题是是:“您您对对目目前前的的住住房房价价格格是是否否满满意意?”调调查查共共设设非非常常不不满满意意、不不满满意意、一一般般、满满意意、非非常常满满意意5 5个个选选项项。调调查查结结果果的的频频数数分分布布如如下下表表所所示示。检检验验该该城城市市居居民民对对房房屋屋价价格格满满意意度度评评价价的的频频数数与与全全国国的的调调查查频频数数是是否一致否一致 拟合优度检验拟合优度检验(期望频数不等期望频数不等)*7-18统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)第第第第1 1步:步:步:步:提出假设提出假设 H H0 0:该城市居民对房屋价格的评价频数与全:该城市居民对房屋价格的评价频数与全 国的评价频数无显著差异国的评价频数无显著差异 H H1 1 :该城市居民对房屋价格的评价频数与全:该城市居民对房屋价格的评价频数与全 国的评价频数有显著差异国的评价频数有显著差异第第第第2 2步:步:步:步:计算期望频数和计算期望频数和 2 2统计量统计量自由度自由度自由度自由度df=df=类别个数类别个数类别个数类别个数-1-1*7-19统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)期望频数计算表期望频数计算表*7-20统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)2 统计量计算表统计量计算表*7-21统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(期望频数不等期望频数不等)第第3步:步:做出决策 由 于 自 由 度=5-1=4,利 用 Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为0.102662,由于P0.05。不拒绝原假设,没有证据表明该城市居民对房屋价格满意度的评价与全国有显著差异*7-22统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS期望频数不等期望频数不等)第第第第1 1步:步:步:步:先指定先指定“频数频数”变量变量第第第第2 2步:步:步:步:选择菜单:选择菜单:【AnalyzeAnalyze】【NonparametricNonparametric TestTest】【ChiChi Square Square】,进入主对话框,进入主对话框第第第第3 3步:步:步:步:将频数变量选入将频数变量选入【Test Variable ListTest Variable List】第第第第4 4步:步:步:步:在在【Expected ValuesExpected Values】下选择下选择【ValuesValues】,并并将将相相应应的的期期望望比比例例(本本例例为为全全国国的的调调查查比比例例)依次输入到框内并点击依次输入到框内并点击【AddAdd】(每次只能输每次只能输 入入1 1个,并点击个,并点击【AddAdd】,然后在输入另一,然后在输入另一 个,再点击个,再点击【AddAdd】)。点击。点击【OKOK】用用用用SPSSSPSS进行检验进行检验进行检验进行检验*7-23统计学统计学STATISTICS(第四版第四版)拟合优度检验拟合优度检验(使用使用SPSS)近近似似的的显显著著性性水水 平平(AsympAsymp.Sig.)Sig.)即即为为P P值值。由由于于P0.05P0.05。不不拒拒绝绝原原假假设设,没没有有证证据据表表明明该该城城市市居居民民对对房房屋屋价价格格满满意意度度的的评评价价与与全全国有显著差异国有显著差异*7.2 两个分类变量的独立性检验两个分类变量的独立性检验 7.2.1 列联表与列联表与 2独立性检验独立性检验 7.2.2 应用应用 2检验应注意的问题检验应注意的问题 第第 7 章章 分类变量的推断分类变量的推断*7.2.1 列联表与列联表与 2独立性检验独立性检验 7.2 两个分类变量的独立性检验两个分类变量的独立性检验*7-26统计学统计学STATISTICS(第四版第四版)1.1.研研究究两两个个分分类类变变量量时时,每每个个变变量量有有多多个个类类别别,通通常常将将两两个变量多个类别的频数用交叉表的形式表示出来个变量多个类别的频数用交叉表的形式表示出来n n一一个个变变量量放放在在行行(row)(row)的的位位置置,称称为为行行变变量量,其其类类别别数数(行行数数)用用r r表示表示n n另另一一个个变变量量放放在在列列(column)(column)的的位位置置,称称为为列列变变量量,其其类类别别数数(列数列数)用用c c表示表示2.2.这这种种由由两两个个或或两两个个以以上上分分类类变变量量交交叉叉分分类类的的频频数数分分布布表表称为称为列联表列联表列联表列联表(contingency table)contingency table)3.3.一个由一个由r r行和行和c c列组成的列联表也称为列组成的列联表也称为r r c c列联表列联表n n例例如如,本本章章开开头头的的案案例例中中,行行变变量量“逃逃课课情情况况”有有两两个个类类别别,列变量列变量“性别性别”也有两个类别,这就是一个也有两个类别,这就是一个2 2 2 2列联表列联表什么是独立性检验什么是独立性检验?(test of independence)*7-27统计学统计学STATISTICS(第四版第四版)1.对对列列联联表表中中的的两两个个分分类类变变量量进进行行分分析析,通通常常是是判断两个变量是否独立判断两个变量是否独立2.该检验的原假设是:两个变量独立该检验的原假设是:两个变量独立(无关无关)n n如如果果原原假假设设被被拒拒绝绝,则则表表明明两两个个变变量量不不独独立立,或或者说两个变量相关者说两个变量相关3.独立性检验的统计量为独立性检验的统计量为 什么是独立性检验什么是独立性检验?(test of independence)自由度自由度自由度自由度df=(r-1)(c-1)df=(r-1)(c-1)*7-28统计学统计学STATISTICS(第四版第四版)【例例7-3】利用本章开头关于学生逃课情况调查的数据,如下表所示。检验性别与逃课情况是否独立 2 独立性检验独立性检验(例例题题分析分析)*7-29统计学统计学STATISTICS(第四版第四版)2 独立性检验独立性检验(例例题题分析分析)第第第第1 1步:步:步:步:提出假设提出假设 H H0 0:性别与是否逃课独立:性别与是否逃课独立 H H1 1 :性别与是否逃课不独立:性别与是否逃课不独立 第第第第2 2步:步:步:步:计算期望频数和计算期望频数和 2 2统计量统计量RTRT为为为为给给给给定定定定单单单单元元元元格格格格所所所所在在在在行行行行的的的的合合合合计计计计频频频频数数数数;CTCT为为为为给给给给定定定定单单单单元元元元格格格格所所所所在在在在列列列列的的的的合合合合计频数;计频数;计频数;计频数;n n为样本量为样本量为样本量为样本量*7-30统计学统计学STATISTICS(第四版第四版)2 独立性检验独立性检验(例例题题分析分析)第第第第2 2步:步:步:步:计算期望频数和计算期望频数和计算期望频数和计算期望频数和 2 2统计量统计量统计量统计量*7-31统计学统计学STATISTICS(第四版第四版)2 独立性检验独立性检验(例例例例题题题题分析分析分析分析)第第3步:步:做出决策 由于自由度=(2-1)(2-1)=1,利用Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为0.159372 ,由于P0.05。不拒绝原假设,可以认为性别与逃课情况独立*7-32统计学统计学STATISTICS(第四版第四版)2 独立性检验独立性检验(使用使用SPSS)将列联表中的将列联表中的数据转换数据转换为原始数据形式为原始数据形式 第第1步:步:选择【Analyze】【Descriptive Statistics-Crosstabs】,进入主对话框第第2步:步:将行变量(本例为“逃课情况”)选入【Row(s)】,将列变 量(本例为“性别”)选入【Column(s)】(行列可以互换)第第3步:步:点击【Statistics】并选中【Chi-square】;点击 【Continue】返回主对话框 点击【Cells】,在【Counts】下选中【Expected】,点击【Continue】返回主对话框。点击【OK】用用用用SPSSSPSS进行检验进行检验进行检验进行检验*7-33统计学统计学STATISTICS(第四版第四版)2 独立性检验独立性检验(使用使用SPSS)近近似似的的显显著著性性水水平平(AsympAsymp.Sig.)Sig.)即即 为为 P P值值。由由 于于P0.05P0.05。不不拒拒绝绝原原假假设设,可可以以认认为为性性别别与与逃逃课课情情况独立况独立 *7.2.2 应用应用 2检验应注意的问题检验应注意的问题 7.2 两个分类变量的独立性检验两个分类变量的独立性检验*7-35统计学统计学STATISTICS(第四版第四版)1.1.在在应应用用 2 2检检验验时时,要要求求样样本本量量应应足足够够大大,特特别别是是每每个个单单元元格格的的期期望望频频数数不不能能太太小小,否否则则应应用用应应检检验验可可能能会会得得出出错错误误的结论的结论n n从从 2 2统统计计量量的的公公式式可可以以看看出出,期期望望频频数数在在公公式式的的分分母母上上,如如果果某某个个单单元元格格的的期期望望频频数数过过小小,统统计计量量的的值值就就会会变变大大,从从而而导导致致拒拒绝原假设绝原假设2.2.应用应用 2 2检验时对单元格的期望频数有以下要求检验时对单元格的期望频数有以下要求n n如如果果仅仅有有两两个个单单元元格格,单单元元格格的的最最小小期期望望频频数数不不应应小小于于5 5。否否则则不能进行不能进行 2 2检验检验n n单单元元格格在在两两个个以以上上时时,期期望望频频数数小小于于5 5的的单单元元格格不不能能超超过过总总格格子子数的数的20%20%,否则不能进行,否则不能进行 2 2检验检验l l如如果果出出现现期期望望频频数数小小于于5 5的的单单元元格格超超过过20%20%,可可以以采采取取合合并并类类别别的的办法来解决这一问题办法来解决这一问题应用应用 2检验检验应注意的问题应注意的问题*7.3 两个分类变量的相关性度量两个分类变量的相关性度量 7.3.1 系数和系数和Cramers V系数系数 7.3.2 列联系数列联系数 第第 7 章章 分类变量的推断分类变量的推断*7.3.1 系数和系数和Cramers V系数系数7.3 两个分类变量的相关性测量两个分类变量的相关性测量*7-38统计学统计学STATISTICS(第四版第四版)1.主要用于主要用于2 2 2 2列联表的相关性测量列联表的相关性测量2.计算公式为计算公式为3.例例7373的的计计算算结结果果,得得到到的的性性别别与与逃逃课课情情况况两两个个变变量量之之间间的的系系数数为为0.1148910.114891。由由于于 很很小小,表表明明性性别别与与逃逃课课情情况况不不存存在在相相关关关关系系。这这与与独独立立性性检检验验的的结结论论是是一致的一致的 系数系数(coefficient)*7-39统计学统计学STATISTICS(第四版第四版)1.由由CramerCramer提出,计算公式为提出,计算公式为 2.Cramers VCramers V系数的取值范围总是在系数的取值范围总是在0101之间之间n n当当两两个个变变量量独独立立时时,V=0V=0;当当两两个个变变量量完完全全相相关关时时,V=1V=1n n如如果果列列联联表表的的行行数数或或列列数数中中有有一一个个为为2 2,Cramers Cramers V V系数就等于系数就等于 系数系数n n例例如如,根根据据例例7373的的计计算算结结果果,得得到到的的性性别别与与逃逃课课情情况两个变量之间的况两个变量之间的Cramers VCramers V系数与系数与 系数一致系数一致 Cramers V系数系数(Cramers V coefficient)*7.3.2 列联系数列联系数7.3 两个分类变量的相关性测量两个分类变量的相关性测量*7-41统计学统计学STATISTICS(第四版第四版)1.主主要要用用于于大大于于2 2 2 2列列联联表表的的相相关关性性测测量量,用用C C表表示示2.计算公式为计算公式为3.联联系系数数不不可可能能大大于于1 1。当当两两个个变变量量独独立立时时,C=0C=0,但但即即使使两两个个变变量量完完全全相相关关,列列联联系系数数也也不不可可能能等等于于1 1,因此,对列联系数含义的解释就不够方便,因此,对列联系数含义的解释就不够方便 列联系数列联系数(contingency coefficient)*7-42统计学统计学STATISTICS(第四版第四版)1.1.使使用用SPSSSPSS进进行行独独立立性性度度检检验验时时,点点击击【StatisticsStatistics】,并并在在【NominalNominal】下下选选中中【Contingency Contingency coefficientcoefficient】和和【Phi and Cramers VPhi and Cramers V】即可即可2.2.根根据据例例710710中中的的数数据据计计算算的的性性别别与与逃逃课课情情况况之之间间的的3 3个个系系数如下数如下(检验结果均不显著检验结果均不显著)相关性测量相关性测量(SPSS应用应用)*7-43统计学统计学STATISTICS(第四版第四版)本章小节本章小节l一个分类变量的拟合优度检验一个分类变量的拟合优度检验一个分类变量的拟合优度检验一个分类变量的拟合优度检验l两个分类变量的独立性检验两个分类变量的独立性检验两个分类变量的独立性检验两个分类变量的独立性检验l应用应用应用应用 2 2检验应注意的问题检验应注意的问题检验应注意的问题检验应注意的问题l两个分类变量的相关性度量两个分类变量的相关性度量两个分类变量的相关性度量两个分类变量的相关性度量 l用用用用SPSSSPSS进行进行进行进行 2 2检验检验检验检验*结结 束束*

    注意事项

    本文((07)第7章 分类变量的推断(2011年).ppt)为本站会员(赵**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开