欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    社会统计学(卢淑华),第十章.pptx

    • 资源ID:80091982       资源大小:3.11MB        全文页数:35页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    社会统计学(卢淑华),第十章.pptx

    4、列联表的一般形式Nij:x=xi y=yj时所具有的频次yxy1y2x1N11N12x2N21N22.xcNc1Nc2.yrN1rN2r.Ncr第1页/共35页学生上网调查(统计各项比例,能发现什么问题?)男生女生聊天玩游戏网恋学习2050151520501515第2页/共35页Nij后者可以通过前者求出 p N N p 1i 1 j 12、列联表中变量的分布1)联合分布对于二变量来说,为了知道分布,集合中的变量值,必须同时具有x和y两个变量的取值。(x1 y1 N11)(x2 y2 N12)(x1 yrN1r)此称联合分布(xi yj Nij)(xc yr Ncr)Nij表示频次时联合频次分布表Pij 表示概率时 联合概率分布表ijNijc ri 1 j 1c rij第3页/共35页2)边缘分布:对联合分布进行简比,只研究其中某一变量的分布,而不管另一变量的取值,这样就得到边缘分布。按行加总y的边缘分布:P y yr P1r P2 r Pcr Pr按列加总x的边缘分布:Px xc Pc1 P2c Pcr Pc第4页/共35页3)条件分布:将其中一个变量控制起来取固定值,再看另一变量的分布,即条件分布。控制x时,条件分布中的每一项都以边缘分布的 N1*N 2*N c*为分母控制y时,条件分布中的每一项都以边缘分布的 N*1 N*2 N*r 为分母第5页/共35页3、列联表中的相互独立性:1)列联表研究定类变量之间的关系,实际上是通过条件分布的比较进行的。如果两个变量之间没有关系,则称变量之间是相互独立的。2)如果两个变量之间是相互独立的,则必然存在变量的条件分布与其边缘分布相同。第6页/共35页条件分布=边缘分布是列联表检验的基础:(控制x时)N*jNNN i*NijNN*jNNijNi*N*1NN 21N 2*N11N1*Pij Pi*P*j 第7页/共35页nin jPi 第二节 列联表的检验一、原假设:将总体中变量间无关系或相互独立作为检验的原假设。H 0:pijpi*p*j总体 pi*和 p*j 未知时,用样本 p i 和 P j 代替。P j n n第8页/共35页22c r2 2ijEijni*n*jnE np*jij第9页/共35页统计量的讨论1、对于22列联表,由于格数过少,为减少作为离散观测值与作为连续型变量x值之间的偏差,可作连续性修正:22 22Eij 2、二项总体2 22E1 E2p0 为总体成数1 2第10页/共35页男女泡吧8030逛商店2070男女休闲爱好第11页/共35页 xni Ei x r 14、使用统计量 x 对列联表迚行检验,每一格值的 E值时 nij Eij 值的波劢就会较大。2那么在计算3、对多项总体:Ei2统计量:r2i 12pEii 0 nij2要保持在一定数目乊上。如果有的格值 Eij 过小,2xEij第12页/共35页每格要求:处理方法:将期望值偏小的格值合并。右例,做检验。Eij20 30 3 1nij182942E ij 5第13页/共35页注意:列联表就其检验内容来看是双边检验,但从形式上看,却又很像单边检验。其判断的内容仅是变量间是否存在关系。至于方向,由于列联表属定类变量,因此是不存在的。第14页/共35页ni Ei xEi 1x r 1列联表检验步骤1、H0H1i222、统计量:r23、4、比较第15页/共35页例:以下是老、中、青三代对某影片的抽样,能否认为三代人对该影片评价有显著差异老中青很高一般454739262122第16页/共35页第三节 列联强度一、变量间的相关1、列联表中的频次分布情况,不仅是检验是否存在关系的依据,同时也是度量变量间关系强弱的依据。相关性程度越高,说明社会现象与社会现象间的关系愈密切。2、列联表中变量间的关系的强度分析,可以将频次转化为条件分布,然后比较自变量取不同值时,因变量条件分布的不同。第17页/共35页例右表中,男生上网玩游生;想一想,当x取值大于2时,怎样比较?戏的比例高于女生;而上网聊天的比例低于女 y x男生女生聊天玩游戏 40 67%10 25%30 33%30 75%第18页/共35页即:ad bc二、2 2表 系数和系数列联表中两个变量都只有二种取值时,就是 22表yxacbdx1x2y1y2当变量间无关系时(独立)a ba c b d对于22表,无论 系数或系数,都以差值 ad bc为基础进行的讨论,同时,也把关系强度的取值范围定义在1,1之间。第19页/共35页1、系数ad bca bc d a cb d 0 当两变量相互独立 1 b、c为零,值最大1a、d为零,值最小-1 1 一般情况前例中计算第20页/共35页Q 2、系数ad-bcad bc当a、b、c、d中有一个是零时,则 Q 1对应的实际情况是配对样本研究3、Q 系数的选择当自变量的不同取值都会影响因变量时,用 系数。当存在控制组时,用系数第21页/共35页xx 值构成 系数4、r c 列联表222Eij 期望频次 Eij 是基于无相关前提下计量出来的,2因 愈大,表示变量间距离无相关性愈远。2 x2 n其与22表中 系数是一致,22表中是 r c表中 系数的特例。第22页/共35页x nc值在0,1但永远小于1,又出现了v系数:由于r c 表的数增多后,值增加,没有上限,无法比较,因此以c系数修正。xc 222minr 1,c 1V 1V 的取值:o V第23页/共35页表示所减少的相对误差,越大表示y与x关2)以减少误差比例为基础的相关性测量PRE不受变量层次的限制,通过现象之间的关系研究,从一个现象预测另一个现象。PRE E1 E 2E1E1 :不知y与x有关系时,预测y的全部误差 E 2:知道y与x有关系后,用x去预测y的全部误差E1 E2E1系越密切。第24页/共35页误差为:jnn max为 nn maxEPRE的取值范围:PRE=0:两变量是无相关(知道x与否无助于y的预测,1 E 2 误差不变)PRE=1:两变量是完全相关的(知道x与y有关系后,可以消除预测的全部误差)0 PRE 1:其他E1:不知y与x 有关,用y的边缘和 n的最大值去猜y值,猜中的频次会更多。全部E 2:知道有关后,先看它属于x的哪一类,然后用这一类的众值去猜y值,误差ciji 1 j第25页/共35页 max n max nn max n 两种系数:*jij *jci 11)系数 E1 E2 E1即:每列最高频次之和 y边缘和中最高频次观察总数 y边缘和中最高频次 的取值范围:x与y无相关:0;x与y全相关:1第26页/共35页PRE,所得 值称作 y,NDPRE,所得 值称作 x,NDDy Dx D D y D D x 值的非对称性:1)以x为自变量,用对y的预测来定义yyy2)以y为自变量,用对x的预测来定义xxx3)如果x和y孰因孰果不明显的情况,这时可同时计算 y 和 x,并取其平均值,作为x和y间的相关程度。xxN y NDy D y x y x 第27页/共35页边缘分布所提供的信息。c rn 1 n Enn Ei 1 j 1 j 11n nEn系数又有修正:系数:对 E1 和 E 2 的定义比当不知道x与y有关系预测y时,充分考虑到y值2rij 2*j1 2 i*r21*jj 1的取值范围:x与y无相关:0(边缘分布与条件分布相同)x与y全相关:1(各行、各列均只有一个不为0的频次)第28页/共35页以前例为参照的推导:1、不知x与y有关:猜游戏与聊天:用边缘分布:40%,60%随机指派40人,猜对游戏的人数4040/100=16猜错的人数40-4040/100=40(1-40/100)=24同理:随机指派60人,猜对聊天的人数6060/100=36猜错的人数60-6060/100=60(1-60/100)=24第29页/共35页j1 n*jE1即为猜错人数之和。推广:1 r 2n n n*2n)n*2(1 n*1nE1 n*1(1)n*r(第30页/共35页知道x与y有关后:用y的条件分布来猜y值当x=男生时随机10人,猜对聊天的人数:1010/50猜错的人数:10-1010/50随机40人,猜对游戏的人数:4040/50猜错的人数:40-4040/50猜错二者相加:=(10-1010/50)+(40-4040/50)=50-1/50(102+402)同理:当x=女生时?第31页/共35页j1E2即为全部误差之和。推广:1 rn1*n 2 ijn i*E 2 (n1*n n 21j)(n 2*)c第32页/共35页值称 y以x为自变量,用对y的预测来定义PRE,所得 值的非对称性:以y为自变量,用对x的预测来定义PRE,所得 y 与 x 是不对称的,因此 是非对称的。第33页/共35页例:值 已知列联表,求yx3012015030602014050200 x1x2y12ya 0.025第34页/共35页感谢您的观看!第35页/共35页

    注意事项

    本文(社会统计学(卢淑华),第十章.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开