统计学-第二章-列联分析..优秀PPT.ppt





《统计学-第二章-列联分析..优秀PPT.ppt》由会员分享,可在线阅读,更多相关《统计学-第二章-列联分析..优秀PPT.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、其次章 列联分析第一节第一节 分类数据与列联表分类数据与列联表其次节其次节 检验检验第三节第三节 列联表的相关测量列联表的相关测量第四节第四节 列联分析中应留意的问题列联分析中应留意的问题2023/4/1412023/4/142背 景统计分析中,我们常常会遇到一些定性的数据性别(男、女)态度(喜欢、不喜欢)性别对态度是否有影响1.可使用列联表分析技术2.可运用对数线性模型与 Logistic模型分析技术2023/4/143主要内容第一节 分类数据与列联表2023/4/144l分分类变量的量的结果表果表现为类别l例如:性例如:性别(男男,女女)l各各类别用符号或数字代用符号或数字代码来来测度度l
2、运用分运用分类或依次尺度或依次尺度l你吸烟你吸烟吗?l1.1.是;是;2.2.否否l你你赞成成还是反是反对这一改革方案一改革方案?l1.1.赞成;成;2.2.反反对l对分分类数据的描述和分析通常运用列数据的描述和分析通常运用列联表表l可运用可运用检验l数数值型数据也可以型数据也可以转化化为分分类数据数据2023/4/145一、分类数据1.由两个以上的由两个以上的变量交叉分量交叉分类的的频数分布表数分布表2.行行变量的量的类别用用 r 表示,表示,ri 表示第表示第 i 个个类别3.列列变量的量的类别用用 c 表示,表示,cj 表示第表示第 j 个个类别4.每种每种组合的合的视察察频数用数用 f
3、ij 表示表示5.表表中中列列出出了了行行变量量和和列列变量量的的全全部部可可能能的的组合,所以称合,所以称为列列联表表6.一个一个 r 行行 c 列的列列的列联表称表称为 r c 列列联表表2023/4/146二、列联表的构造-列联表(contingency table)2023/4/147列联表的结构(2 2 列联表)列列(cj)合计合计j=1j=1i=1f11f12f11+f12i=2f21f22f21+f22合计合计f11+f21f12+f22n列列列列(c c c cj j j j)行行行行 (r r r ri i i i)2023/4/148列联表的结构(r c 列联表的一般表示)
4、列列(cj)合计合计j=1j=2i=1f11f12r1i=2f21f22r2:合计合计c1c2n列列(c cj j)行行(r ri i)fij 表示第表示第 i 行第行第 j 列的视察频数列的视察频数2023/4/149例例题分析分析一分公司二分公司三分公司四分公司合计合计赞成该方案赞成该方案6868757557577979279279反对该方案反对该方案3232757533333131141141合计合计1001001201209090110110420420【例例】一一个个集集团团公公司司在在四四个个不不同同的的地地区区设设有有分分公公司司,现现该该集集团团公公司司欲欲进进行行一一项项改改
5、革革,此此项项改改革革可可能能涉涉及及到到各各分分公公司司的的利利益益,故故接接受受抽抽样样调调查查方方式式,从从四四个个分分公公司司共共抽抽取取420420个个样样本本单位单位(人人),了解职工对此项改革的看法,调查结果如下表,了解职工对此项改革的看法,调查结果如下表1.边缘分布分布2.行行边缘分布分布3.行行视察察值的合的合计数的分布数的分布4.例例如如,赞成成改改革革方方案案的的共共有有279人人,反反对改改革革方方案的案的141人人5.列列边缘分布分布6.列列视察察值的合的合计数的分布数的分布7.例例如如,四四个个分分公公司司接接受受调查的的人人数数分分别为100人人,120人,人,9
6、0人,人,110人人8.条件分布与条件条件分布与条件频数数9.变量量 X 条条件件下下变量量Y 的的分分布布,或或在在变量量Y 条条件件下下变量量 X 的分布的分布10.每个具体的每个具体的视察察值称称为条件条件频数数2023/4/14102023/4/1411一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司合计合计赞成该方案赞成该方案6868757557577979279279反对该方案反对该方案3232454533333131141141合计合计1001001201209090110110420420行边缘分布行边缘分布列边缘分布列边缘分布条件频数条件频数1.条件条件频数反
7、映了数据的分布,但不适合数反映了数据的分布,但不适合对比比2.为在在相相同同的的基基数数上上进行行比比较,可可以以计算算相相应的百分比,称的百分比,称为百分比分布百分比分布3.行行百百分分比比:行行的的每每一一个个视察察频数数除除以以相相应的的行合行合计数数(fij/ri)4.列列百百分分比比:列列的的每每一一个个视察察频数数除除以以相相应的的列合列合计数数(fij/cj)5.总百百分分比比:每每一一个个视察察值除除以以视察察值的的总个个数数(fij/n)2023/4/14122023/4/1413一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司合计合计赞成该方案赞成该方案24
8、.4%24.4%26.9%26.9%20.4%20.4%28.3%28.3%66.4%66.4%68.0%68.0%62.5%62.5%63.3563.3571.8%71.8%16.2%16.2%17.8%17.8%13.6%13.6%18.8%18.8%反对该方案反对该方案22.7%22.7%31.9%31.9%23.4%23.4%22.0%22.0%33.6%33.6%32.0%32.0%37.5%37.5%36.7%36.7%28.2%28.2%7.6%7.6%10.7%10.7%7.9%7.9%7.4%7.4%合计合计23.8%23.8%28.6%28.6%21.4%21.4%26.2
9、%26.2%100%100%总百分比总百分比列百分比列百分比行百分比行百分比1.假定行假定行变量和列量和列变量是独立的量是独立的2.一一个个实际频数数 fij 的的期期望望频数数 eij,是是总频数数的的个个数数 n 乘乘以以该实际频数数 fij 落落入入第第 i 行行 和第和第j列的概率,即列的概率,即2023/4/14142023/4/1415由于视察频数的总数为由于视察频数的总数为n,所以,所以f11 的期望频数的期望频数 e11 应应为为例例如如,第第1行行和和第第1列列的的实实际际频频数数为为 f11,它它落落在在第第1行行的的概概率率估估计计值值为为该该行行的的频频数数之之和和r1
10、除除以以总总频频数数的的个个数数 n,即即:r1/n;它它落落在在第第1列列的的概概率率的的估估计计值值为为该该列列的的频频数数之之和和c1除除以以总总频频数数的的个个数数 n,即即:c1/n。依依据据概概率率的乘法公式,该频数落在第的乘法公式,该频数落在第1行和第行和第1列的概率应为列的概率应为2023/4/142023/4/141616一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司赞成该赞成该方方 案案实际频数实际频数6868757557577979期望频数期望频数6666808060607373反对该反对该方方 案案实际频数实际频数3232757533333131期望频
11、数期望频数3434404030303737其次节其次节 检验检验 一、一、统计量统计量 二、拟合优度检验二、拟合优度检验2023/4/14171.用于用于检验列列联表中表中变量量间拟合合优度和独立性度和独立性2.用于用于测定两个分定两个分类变量之量之间的相关程度的相关程度 3.计算公式算公式为 其自由度其自由度为 式中式中 -列列联表中第表中第i行第行第j列列类别的的实际频数数 -列列联表中第表中第i行第行第j列列类别的期望的期望频数数2023/4/1418一、一、统计量量2023/4/1419实际频数实际频数(fij)期望频数期望频数(eij)fij-eij(fij-eij)2(fij-ei
12、j)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合计:合计:3.03192023/4/1420二、二、拟合合优度度检验(品品质数据的假数据的假设检验)品质数据品质数据比例检验比例检验独立性检验独立性检验Z Z 检验检验一个总体 检验检验Z Z 检验检验 检验检验两个以上总体两个总体1.检验多个比例是否相等多个比例是否相等2.检验的步的步骤提出假提出假设lH0:1=2=j;H1:1,2,j 不全相等不全相等 计算算检验的的统计
13、量量2023/4/1421拟合合优度度检验(goodness of fit test)进行决策进行决策 依据显著性水平依据显著性水平 和自由度和自由度(r-1)(c-1)查出临界值查出临界值2 若若 22,拒绝,拒绝H0;若;若 22,接受,接受H0H0:1=2=3=4 H1:1,2,3,4 不全相等不全相等=0.1df=(2-1)(4-1)=3临界界值(s):拟合合优度度检验(例例题分析分析)统计量统计量:在在 =0.1的水平上不能拒绝的水平上不能拒绝H0可以认为四个分公司对改革方案的赞成比可以认为四个分公司对改革方案的赞成比例是一样的例是一样的 决策决策:结论结论:6.2513.0319
14、=0.10 【例例】为为了了提提高高市市场场占占有有率率,A A公公司司和和B B公公司司同同时时开开展展了了广广告告宣宣扬扬。在在广广告告宣宣扬扬战战之之前前,A A公公司司的的市市场场占占有有率率为为45%45%,B B公公司司的的市市场场占占有有率率为为40%40%,其其他他公公司司的的市市场场占占有有率率为为15%15%。为为了了了了解解广广告告战战之之后后A A、B B和和其其他他公公司司的的市市场场占占有有率率是是否否发发生生变变更更,随随机机抽抽取取了了200200名名消消费费者者,其其中中102102人人表表示示准准备备购购买买A A公公司司产产品品,8282人人表表示示准准备
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第二 分析 优秀 PPT

限制150内