欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学 第四版(cha9).ppt

    • 资源ID:85138992       资源大小:731KB        全文页数:30页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学 第四版(cha9).ppt

    第九章第九章 列联分析列联分析分类数据与列联表分类数据与列联表1拟合优度与独立性检验拟合优度与独立性检验2列联表中的相关测量列联表中的相关测量3 分布的期望值准则分布的期望值准则4n分类数据分类数据数据有三类,分类数据、顺序数据、数值数据。数据有三类,分类数据、顺序数据、数值数据。但后两类数据也都可以转化为分类数据。对于但后两类数据也都可以转化为分类数据。对于两个分类数据进行分析,可以用列联表两个分类数据进行分析,可以用列联表n列联表的构造列联表的构造两个以上的变量进行交叉分类的频数分布表,两个以上的变量进行交叉分类的频数分布表,称为列联表称为列联表第一节第一节 分类数据与列联表分类数据与列联表例:一个集团公司在四个不同的区域设有分公司,例:一个集团公司在四个不同的区域设有分公司,现该集团公司欲进行一项改革。从四个分公现该集团公司欲进行一项改革。从四个分公司共抽取司共抽取420个样本单位,了解职工对此项改个样本单位,了解职工对此项改革的看法。调查结果如表所示。革的看法。调查结果如表所示。关于改革方案的调查结果关于改革方案的调查结果一分公司一分公司 二分公司二分公司 三分公司三分公司 四分公司四分公司合计合计赞成改赞成改革方案革方案反对改反对改革方案革方案 68 75 57 79 32 45 33 31279141合计合计 100 120 90 110420n列联表的分布列联表的分布一个列联表可以看成是一个两元随机向量的分布表一个列联表可以看成是一个两元随机向量的分布表 包含百分比的包含百分比的2x4列联表列联表一分公司一分公司 二分公司二分公司 三分公司三分公司 四分公司四分公司合计合计赞成改赞成改革方案革方案68 75 57 79 24.4 26.9 20.4 28.3 68.0 62.5 63.3 71.8 16.2 17.9 13.6 18.827966.4-反对改反对改革方案革方案 32 45 33 31 22.7 31.9 23.4 22.0 32.0 37.5 36.7 28.2 7.6 10.7 7.9 7.414133.6-合计合计 100 120 90 110420n 检验检验将样本分成将样本分成 n类,每类实际出现的频数用类,每类实际出现的频数用 表表示,其理论频数为示,其理论频数为 ,当样本容量充分大时,当样本容量充分大时,则则 统计量为统计量为 服从分布服从分布 ,其中其中n-1为自由度为自由度第二节第二节 拟合优度与独立性检验拟合优度与独立性检验n拟合优度检验拟合优度检验利用随机样本资料,对总体是否服从某种理论利用随机样本资料,对总体是否服从某种理论分布进行的检验,称为分布进行的检验,称为拟合优度检验拟合优度检验例如:航空业官员在理论上认为机票购买者的例如:航空业官员在理论上认为机票购买者的年龄服从某种特殊的分布(称为期望分布)。年龄服从某种特殊的分布(称为期望分布)。为了接受或拒绝该分布,随机选取机票购买者为了接受或拒绝该分布,随机选取机票购买者年龄的真实样本,使用拟合优度检验比较观察年龄的真实样本,使用拟合优度检验比较观察值与期望值值与期望值又如:在皮鞋制造业,生产商可以使用拟合优又如:在皮鞋制造业,生产商可以使用拟合优度检验确定一年当中对其商品的需求是否服从度检验确定一年当中对其商品的需求是否服从均匀分布均匀分布n拟合优度检验示例拟合优度检验示例例例1:有四厂家生产同类产品在过去的一年里,市场份额有四厂家生产同类产品在过去的一年里,市场份额稳定在稳定在A公司公司47,B公司公司34,公司,公司11%和和D公公司司8%.最近各家公司都开发了各自最近各家公司都开发了各自“新型和改进型新型和改进型”的产品代替原有的产品。因此,的产品代替原有的产品。因此,A公司市场营销部门公司市场营销部门想知道这些新产品是否改变了市场份额。于是请评估想知道这些新产品是否改变了市场份额。于是请评估公司组织进行一个抽样调查:随机选择了该城市在各公司组织进行一个抽样调查:随机选择了该城市在各大超市购物的大超市购物的207个消费者,以了解他们会选择哪种个消费者,以了解他们会选择哪种产品。结果选用产品。结果选用A、B、C、D公司产品的消费者比例公司产品的消费者比例为为 从抽样结果判断市场份额有没有发生变化从抽样结果判断市场份额有没有发生变化 n拟合优度检验示例拟合优度检验示例(续续)例例2:某消费者协会想确定市场上某消费者协会想确定市场上5种牌种牌子的啤酒哪一种最受消费者欢迎。子的啤酒哪一种最受消费者欢迎。该协会随机抽取该协会随机抽取1000名啤酒饮用名啤酒饮用者作为样本进行如下的实验:每者作为样本进行如下的实验:每个人得到个人得到5种牌子的啤酒各一瓶,种牌子的啤酒各一瓶,但都未标明牌子;这但都未标明牌子;这5瓶啤酒分瓶啤酒分别贴着标有别贴着标有A、B、C、D、E字字母的纸片以随机确定的顺序送给母的纸片以随机确定的顺序送给每一个人。下表是根据样本资料每一个人。下表是根据样本资料整理得到的各种牌子啤酒爱好者整理得到的各种牌子啤酒爱好者的频数分布。判断消费者对这几的频数分布。判断消费者对这几种牌子的爱好有没有差别种牌子的爱好有没有差别.最喜欢最喜欢的牌子的牌子人数人数A210B312C170D85E223合计合计1000n拟合优度检验的步骤拟合优度检验的步骤(1)对总体分布建立假设)对总体分布建立假设H0:总体服从某种理论分布总体服从某种理论分布H1:总体不服从该理论分布总体不服从该理论分布(2)抽样并对样)抽样并对样本资料编成频数本资料编成频数分布(分布(f0)(3)以)以“原假设原假设H0为真为真”导出一组导出一组期望频数(期望频数(fe)(4)计算检验统)计算检验统计量计量2=(f0-fe)2/fe(5)对给定的)对给定的查查2表,得到临界值表,得到临界值(6)比较)比较值与临界值值与临界值作出检验判断作出检验判断注意事项注意事项(1)各组理)各组理论频数论频数fe不得不得小于小于5,如不,如不足足5,可合并,可合并组;组;(2)为使组)为使组数不致太少,数不致太少,总频数总频数n50;(3)根据具)根据具体情况确定体情况确定自由度。自由度。n拟合优度检验示例分析(例)拟合优度检验示例分析(例)步骤一:建立如下假设:步骤一:建立如下假设:即各公司的市场份额没有发生变化即各公司的市场份额没有发生变化 至少有一至少有一个不成立个不成立,即各公司的市场份额发生了变化即各公司的市场份额发生了变化步骤二:确定使用的检验统计量步骤二:确定使用的检验统计量步骤三:取步骤三:取。由于。由于拟合优度检验是单边检验,拟合优度检验是单边检验,且当等于零时表明理论分布与实际分布是一致且当等于零时表明理论分布与实际分布是一致的。与零的任何偏差都是正的,这是因为的。与零的任何偏差都是正的,这是因为是由是由平方和确定的,平方和确定的,永远不会是负值。在此题中,由永远不会是负值。在此题中,由于于n n4 4,所以自由度所以自由度n-1=3n-1=3,在在的条件的条件下,临界值为下,临界值为决策准则:如果计算得到的样本检验统计量的值大于决策准则:如果计算得到的样本检验统计量的值大于7.8157.815,则拒绝原假设,否则则不能拒绝,则拒绝原假设,否则则不能拒绝步骤四:计算样本检验统计量的值。分以下几步完成:步骤四:计算样本检验统计量的值。分以下几步完成:(1)计算期望值(理论频数,见表)计算期望值(理论频数,见表)表:公司份额期望频数的计算表:公司份额期望频数的计算公司公司期望比例期望比例期望频数()期望频数()A47(0.47)(207)=97.29B34(0.34)(207)=70.38C11(0.11)(207)=22.77D8%(0.08)(207)=16.56(2)计算)计算 拟合优度检验统计量的值拟合优度检验统计量的值 由表知,由表知,6.25步骤五:计算出的卡方检验统计量的值明显小于临界值,步骤五:计算出的卡方检验统计量的值明显小于临界值,所以不拒绝原假设,即认为新产品没有改变市场所以不拒绝原假设,即认为新产品没有改变市场 份额份额 拒绝原假设拒绝原假设=7.8156.25不拒绝原假设不拒绝原假设n拟合优度检验示例分析(例拟合优度检验示例分析(例2)如果没有差别,则应预期啤酒饮用者的人数呈均匀分如果没有差别,则应预期啤酒饮用者的人数呈均匀分布(每种牌子啤酒的爱好者各占布(每种牌子啤酒的爱好者各占20%)H0:不同牌子饮用者人数服从均匀分布不同牌子饮用者人数服从均匀分布 H1:不同牌子饮用者人数不服从均匀分布不同牌子饮用者人数不服从均匀分布 显著性水平为显著性水平为0.05,df=5-1=4,拒绝域为拒绝域为 9.488根据原假设根据原假设,每种牌子啤酒爱好者的理论频数为每种牌子啤酒爱好者的理论频数为200 由于由于136.49.488,所以拒绝原假设所以拒绝原假设结论:消费者对各款啤酒的爱好有差别结论:消费者对各款啤酒的爱好有差别n独立性检验独立性检验例:在对某城市家庭的社会经济特征调查中,调查者例:在对某城市家庭的社会经济特征调查中,调查者同时想确定家庭的电话拥有量与汽车拥有量是否独立。同时想确定家庭的电话拥有量与汽车拥有量是否独立。该公司对该公司对10000户家庭组成的简单随机样本进行调查,户家庭组成的简单随机样本进行调查,获得资料如下表。设显著性水平为获得资料如下表。设显著性水平为0.01n列联表(观察值)列联表(观察值)n列联表(理论频数的计算)列联表(理论频数的计算)n检验统计量的构造检验统计量的构造n独立性检验的步骤独立性检验的步骤(1)对总体的两个变量建立假设)对总体的两个变量建立假设H0:两变量独立两变量独立H1:两变量关联两变量关联(2)将样本资料编成)将样本资料编成rk列联表,并列出实列联表,并列出实际频数际频数Oij(3)计算理论频数)计算理论频数(4)计算检验统计量)计算检验统计量(5)给定的给定的查查2表,表,得到临界值得到临界值(6)比较)比较2值与临界值与临界值作出检验判断值作出检验判断n n例题分析例题分析例题分析例题分析解:解:H0:汽车拥有量与电话拥有量是独立的汽车拥有量与电话拥有量是独立的 H1:汽车拥有量与电话拥有量是不独立的汽车拥有量与电话拥有量是不独立的将观察频数与理论频数排在一起,并将理论频数置于括号内将观察频数与理论频数排在一起,并将理论频数置于括号内由表计算得到检验统计量:由表计算得到检验统计量:显著水平为显著水平为0.01自由度自由度n=(r-1)(k-1)=(3-1)(3-1)=4查表得,所以拒绝查表得,所以拒绝H0 结论:汽车拥有量与电话拥有量不是独立的结论:汽车拥有量与电话拥有量不是独立的第三节第三节 列联表中的相关测量列联表中的相关测量n品质相关品质相关如果独立性检验结果为不独立,那相关程度有多大如果独立性检验结果为不独立,那相关程度有多大?两个变量之间相关程度的测定,主要用相关系数?两个变量之间相关程度的测定,主要用相关系数表示。分类数据之间的相关称为品质相关。表示。分类数据之间的相关称为品质相关。常用的品质相关系数有:常用的品质相关系数有:相关系数相关系数 列相关系数列相关系数 相关系数相关系数n 相关系数相关系数 它仅适用于它仅适用于2X2列联表列联表对于左侧的确表格,可对于左侧的确表格,可以表示成下列算式:以表示成下列算式:因素因素因因 素素合计合计合计合计n列联相关系数列联相关系数又称列联系数又称列联系数 它适用于一般列联表。它适用于一般列联表。时,两个变量相互独立。时,两个变量相互独立。它的最大值依赖于行数和列数。它的最大值依赖于行数和列数。优点:对总体分布无要求优点:对总体分布无要求缺点:不同行数和列数的列联相关系数间不能比较缺点:不同行数和列数的列联相关系数间不能比较n 相关系数相关系数又称列联系数又称列联系数 它适用于一般列联表。它适用于一般列联表。时,两个变量相互独立。时,两个变量相互独立。时,两个变量完全相关。时,两个变量完全相关。当列联表中有一维为当列联表中有一维为2时,时,n数值分析数值分析例:一种原料来自三个不同的地区,原料质量被分成三个例:一种原料来自三个不同的地区,原料质量被分成三个等级。从这批原料中随机抽取等级。从这批原料中随机抽取500件进行检验,结果件进行检验,结果如下表所示:如下表所示:要求计算品质相关系数。要求计算品质相关系数。一级一级 二级二级 三级三级合计合计甲地区甲地区乙地区乙地区丙地区丙地区 52 64 24 60 59 52 50 65 74140171189合计合计 162 188 150500第四节第四节 分布的期望值准则分布的期望值准则n关于关于 的两项准则的两项准则准则一:如果只有两个单元,每个单元的期望频数准则一:如果只有两个单元,每个单元的期望频数 必须大于等于必须大于等于5,才能用,才能用 检验检验准则二:如果有两个以上的单元,且准则二:如果有两个以上的单元,且20%的单元期的单元期 望频数小于望频数小于5,则不能用,则不能用 检验检验类别类别A B C D E F合计合计28 49 18 6 92 2021326 47 23 4 88 25213例:例:注意到注意到 和和 很接近,故应该拟合很好。但很接近,故应该拟合很好。但 所以拒绝原假设。若将所以拒绝原假设。若将E、F、G合并,则有合并,则有此时有此时有所以不拒绝原假设。所以不拒绝原假设。类别类别A B C D E F G合计合计30 110 86 23 5 5 426332 113 87 24 2 4 1263

    注意事项

    本文(统计学 第四版(cha9).ppt)为本站会员(gsy****95)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开