欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学教程含六 列联分析幻灯片.ppt

    • 资源ID:48327507       资源大小:2.81MB        全文页数:51页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学教程含六 列联分析幻灯片.ppt

    统计学教程含六 列联分析第1页,共51页,编辑于2022年,星期二列联表中的卡方检验列联表中的相关性测量第2页,共51页,编辑于2022年,星期二 某集团公司打算进行一项改革,但此项改革涉及到各分公司的利益。今采用抽样方法分别从下设的四个分公司中共抽取420名职工了解对此项改革的看法。如果四个分公司对改革的看法一致,则决定实施这项改革。调查结果如下表所示:公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果的样本数据列联表是描述两个分类变量的频数分布表。列联表中的卡方检验第3页,共51页,编辑于2022年,星期二 C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4nRC列联表取值多的变量表示为列变量取值少的变量表示为行变量列变量单元频数的合计行变量单元频数的合计样本容量单元观察频数列联表的一般结构列联表中的卡方检验第4页,共51页,编辑于2022年,星期二公司1公司2公司3公司4合计赞成频数68755779279比率%68.062.563.371.866.4反对频数32453331141比率%32.037.536.728.233.6合计频数10012090110420比率%100100100100100赞成或反对的比率的样本数据从样本数据上看,各公司的赞成(反对)比率存在差异。从样本到总体的外推可通过假设检验完成。赞成的比率一致。赞成的比率不一致。列联表中的卡方检验第5页,共51页,编辑于2022年,星期二如果 为真,则总比率对各公司都适用。于是可根据总比率得出各单元的期望频数。公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420公司1公司2公司3公司4合计赞成66806073279反对34403037141合计10012090110420 观察频数(observed frequency 简写f0)期望频数(expected frequency 简写fe)总赞成比率:总反对比率:该单元的期望频数该单元所在行总频数该单元所在列总频数样本容量列联表中的卡方检验第6页,共51页,编辑于2022年,星期二04260.000.050.100.150.250.208100.30观察频数与期望频差异的大小以 统计量衡量。统计量服从自由度为 的分布。自由度为3 的分布自由度为1 的分布自由度为10 的分布自由度为20 的分布列联表中的卡方检验第7页,共51页,编辑于2022年,星期二寻找自由度 自由度是可以自由取值的数据个数。列联表中的行与列的总和是固定的。总有一行和一列的取值不是自由的。自由度=(R-1)(C-1)=(2-1)(2-1)。C1C2合计R1f11f12RT1R2f21f22RT2合计CT1CT2n列联表中的卡方检验第8页,共51页,编辑于2022年,星期二公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420 关于改革方案调查结果样本数据列联表的自由度自由度=列联表中的卡方检验第9页,共51页,编辑于2022年,星期二自由度用以衡量列联表的大小。C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT434列联表26列联表C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4C1C2C3C4C5C6合计R1f11f12f13f14f15f16RT1R2f21f22f23f24f25f26RT2合计CT1CT2CT3CT4CT5CT6列联表中的卡方检验第10页,共51页,编辑于2022年,星期二687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.97303.0319列联表中的卡方检验第11页,共51页,编辑于2022年,星期二6.2513.0319拒绝域接受域结论:接受“赞成的比率一致”的原假设。即集团公司所属四个分公司的全体职工一致赞成此项改革。样本数据中赞成比率的差异由抽样的随机性所造成。自由度为3的 分布经计算查表得临界值已知自由度=0列联表中的卡方检验第12页,共51页,编辑于2022年,星期二 某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。淡啤普啤 黑啤合计男性20402080女性30301070合计507030150男性与女性饮者啤酒偏好的样本数据列联表中的卡方检验第13页,共51页,编辑于2022年,星期二从样本数据上看,男性与女性的啤酒偏好比率存在差异。淡啤普啤 黑啤合计频数比率%频数比率%频数比率%频数比率%男性2025.04050.02025.080100女性3042.93042.91014.270100合计5033.37046.73020.0150100 从样本到总体的外推应通过假设检验完成。不同性别饮酒偏好比率的样本数据男性与女性啤酒偏好相同男性与女性啤酒偏好不同列联表中的卡方检验第14页,共51页,编辑于2022年,星期二 如果H0为真,则代表饮酒偏好的总比率对男性和女性饮酒者都适用,于是可根据总比率得出各单元的期望频数。淡啤普啤 黑啤合计男性26.6737.3316.0080女性23.3332.6714.0070合计507030150观察频数(observed frequency 简写f0)期望频数(expected frequency 简写fe)总比率:淡啤普啤黑啤淡啤普啤 黑啤合计男性20402080女性30301070合计507030150式中:该单元的期望频数该单元所在行总频数该单元所在列总频数样本容量期望频数:列联表中的卡方检验第15页,共51页,编辑于2022年,星期二注意:用 进行假设检验时,每一单元的期望频数至少为5。当某一单元的期望频数小于时,通常将相年邻的类合并以使每一单元的期望频数大于或等于5。服从自由度为(R-1)(C-1)的 分布。列联表中的卡方检验第16页,共51页,编辑于2022年,星期二性别偏好男男男女女女淡啤普啤黑啤淡啤普啤黑啤20402030301026.6737.3316.0023.3332.6714.00-6.672.674.006.67-2.67-4.0044.497.1316.0044.497.1316.001.670.191.001.910.221.146.13判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算列联表中的卡方检验第17页,共51页,编辑于2022年,星期二结论:拒绝 “男性与女性啤酒偏好相同”的原假设并接受“男性与女性啤酒偏好不同”的备择假设。即啤酒的偏好与性别是有关联的。已知:自由度=查表得临界值:经计算:列联表中的卡方检验第18页,共51页,编辑于2022年,星期二相关系数C相关系数V相关系数列联表中的相关性测量第19页,共51页,编辑于2022年,星期二相关系数计算公式适用于2 2列联表C1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表无相关完全相关弱相关中度相关高度相关相关系数第20页,共51页,编辑于2022年,星期二C1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表化简得:可充当测量相关性的尺度。即:因为于是得:变量 与变量 不相关时,有因此,相关系数第21页,共51页,编辑于2022年,星期二22列联表完全相关的两种情况C1C2合计R1a0a+bR20dc+d合计a+cb+dn22列联表C1C2合计R10ba+bR2c0c+d合计a+cb+dn相关系数第22页,共51页,编辑于2022年,星期二 相关系数与 统计量的关系C1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表或相关系数第23页,共51页,编辑于2022年,星期二 丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就“你认为大多数人都可信赖呢?还是认为与人相处要处处小心?”这一问题,获得数据如下表。要求:判定“国籍”与“态度”两变量间的相关性。丹麦法国合计信任625206831怀疑3607631123合计985969195422列联表相关系数比较适用于22列联表。列联表的行数和列数大于2时,相关系数会出现大于是1情况。相关系数第24页,共51页,编辑于2022年,星期二适用于大于2 2列联表列联表223344C的最大值0.70710.81650.87的最大值依赖于列联表的行列数无相关相关系数(列联系数)计算公式C相关系数第25页,共51页,编辑于2022年,星期二 一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示:一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500原料抽样数据要求:检验地区与原料质量之间有无依赖关系。C相关系数第26页,共51页,编辑于2022年,星期二性别偏差11122233312312312352642460595250657445.3652.6442.0055.4064.3051.3061.2471.0656.706.6411.36-18.004.60 5.300.70-11.24-6.0617.3044.09129.05324.0021.1628.090.49126.3436.72299.290.972.457.710.380.440.012.060.525.28合计19.82为判定地区是否与原料质量相关所需 统计量的计算C相关系数第27页,共51页,编辑于2022年,星期二适用于大于2 2列联表计算结果表明:“地区”与“原料质量”之间低度相关。列联表行数和列数中较小者。相关系数计算公式V相关系数解决了相关系数无上界和C相关系数小于1的情况。两个变量无相关时V=0;两个变量完全相关时V=1。V相关系数第28页,共51页,编辑于2022年,星期二结 束第29页,共51页,编辑于2022年,星期二用SPSS作卡方分析第30页,共51页,编辑于2022年,星期二公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果的样本数据态度赞成反对r12公司公司1公司2公司3公司4 c 1 2 3 4观察频数 fo定义变量68755779324533313142833327452263212579414573137521268111focr序号列联表在spss数据集中的排列数据集9第31页,共51页,编辑于2022年,星期二1、打开数据集;2、点击data;2、点击weight cases;弹出weight cases对话框;3、选择weight cases by;4、将变量Fo点击进入frequency variable框内,对其进行加权。第32页,共51页,编辑于2022年,星期二1、点击analyze;2、选择descriptive statistics;3、在下拉菜单中选择crosstabs,进行列联表分析。第33页,共51页,编辑于2022年,星期二显示交叉频数分布图指定行变量指定列变量第34页,共51页,编辑于2022年,星期二卡方检验定类变量相关指标相关分析列联系数和V系数值不确定系数定序变量的相关指标本例中选择chi-square第35页,共51页,编辑于2022年,星期二频数观察频数期望频数频率行频率列频率总和频率残差未标准化已标准化已由标准误标准化本例中选择频数中的两选项第36页,共51页,编辑于2022年,星期二升序行顺序降序第37页,共51页,编辑于2022年,星期二第38页,共51页,编辑于2022年,星期二第39页,共51页,编辑于2022年,星期二故接受原假设。即四个分公司态度一致。第40页,共51页,编辑于2022年,星期二 如果在crosstabs cell display对话中,选择了count中的observed和expected 与percentages中的row、column和total,系统将输出如下列联表。第41页,共51页,编辑于2022年,星期二 C fo r意 见合计不能满足基本满足能够满足系别金融系统计系7070160602010250140合 计14022030390 为了解非计算机专业对计算机课程教学的意见,在金融系和统计系本科生中进行了一次抽样调查,得到了390名学生的调查数据。试据此推断两系本科生对计算机课程教学的意见是否一致。关于计算机课程教学意见的样本数据数据集10第42页,共51页,编辑于2022年,星期二第43页,共51页,编辑于2022年,星期二第44页,共51页,编辑于2022年,星期二第45页,共51页,编辑于2022年,星期二第46页,共51页,编辑于2022年,星期二第47页,共51页,编辑于2022年,星期二 两变量间的关系及自变量X统计分析方法选择分类型变量顺序型变量数值型变量因变量 Y数值型变量方差分析回归分析顺序型变量秩的方法分类型变量卡方分析逻辑斯蒂分析第48页,共51页,编辑于2022年,星期二结 束第49页,共51页,编辑于2022年,星期二列联表(contingency table):在卡方检验中,用于汇总观察频数与期频数的表格。卡方分布(chi-square distribution):一种概率分布。随着自由度的增大,卡方分布将趋近于正态分布。常用于列联表中变量之间是否相关的检验,尤其适合于两个定类变量之间是否相关的检验。观察频数(observed frequency):列联表中的实际观测频数。期望频数(expected frequency):为检验列表中变量的独立性,而根据观察频数计算出来的理论频数。列联系数(coefficient of contingency):简称C系数主要用于大于22列联表中变量间相关程度的测定。关键术语第50页,共51页,编辑于2022年,星期二结 束第51页,共51页,编辑于2022年,星期二

    注意事项

    本文(统计学教程含六 列联分析幻灯片.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开