统计学原理chaer硕士列联表和卡方拟合优度非参数检验方法稿PPT课件.ppt
《统计学原理chaer硕士列联表和卡方拟合优度非参数检验方法稿PPT课件.ppt》由会员分享,可在线阅读,更多相关《统计学原理chaer硕士列联表和卡方拟合优度非参数检验方法稿PPT课件.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章 列联分析与卡方拟合优度检验9.1 分类数据与列联表分类数据与列联表 9.2 拟合优度检验拟合优度检验9.3 独立性检验独立性检验9.4 列联表中的相关测量列联表中的相关测量9.5 列联分析中应注意的问题列联分析中应注意的问题学习目标1.解释列联表解释列联表2.进行进行 c c2 检验检验n一致性检验一致性检验n独立性检验独立性检验3.测度列联表中的相关性测度列联表中的相关性9.1 分类数据与列联表分类数据与列联表 n9.1.1分类数据分类数据n9.1.2列联表的构造列联表的构造n9.1.3列联表的分布列联表的分布 9.1.1定性数据定性数据数据的类型与列联分析数数据据定量数据定量数据(
2、数值型数据数值型数据)定性数据定性数据(品质数据品质数据)离散数据离散数据连续数据连续数据列联分析列联分析.review:品质数据1.品质随机变量的结果表现为类别n例如:性别(男,女)2.各类别用符号或数字代码来测度3.使用定类或定序尺度n你吸烟吗?n1.是;2.否n你对某种产品售后服务的满意度?n1.满意;2.说不好;3.不满意4.对品质数据的描述和分析通常使用列联表5.可使用检验9.1.2列联表的构造1.由两个以上的变量进行交叉分类的频数分布表2.行变量的类别用 r 表示,ri 表示第 i 个类别3.列变量的类别用 c 表示,cj 表示第 j 个类别4.每种组合的观察频数用 fij 表示5
3、.表中列出了行变量和列变量的所有可能的组合,所以称为列联表6.一个 r 行 c 列的列联表称为 r c 列联表列联表的概念列联表的结构(2 列联表)列列(cj)合计合计j=1j=1i=1f11f12f11+f12i=2f21f22f21+f22合合计计f11+f21f12+f22n列列列列(c cj j)行行行行 (r ri i)列联表的结构(r c 列联表的一般表示)列列(cj)合计合计j=1j=2i=1f11f12r1i=2f21f22r2:合合计计c1c2n列列列列(c cj j)行行行行(r ri i)f fij ij 表示第表示第表示第表示第 i i 行第行第行第行第 j j 列的观
4、察频数列的观察频数列的观察频数列的观察频数列联表的一个实际例子一分公司二分公司三分公司四分公司合计合计赞成该方案68755779279反对该方案32453331141合合计计10012090110420【例例例例】一一个个集集团团公公司司在在四四个个不不同同的的地地区区设设有有分分公公司司,现现该该集集团团公公司司欲欲进进行行一一项项改改革革,此此项项改改革革可可能能涉涉及及到到各各分分公公司司的的利利益益,故故采采用用抽抽样样调调查查方方式式,从从四四个个分分公公司司共共抽抽取取420420个个样样本本单位单位(人人),了解职工对此项改革的看法,调查结果如下表,了解职工对此项改革的看法,调查
5、结果如下表9.3.1列联表中的分布边缘分布行边缘分布列边缘分布条件分布与条件频数变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量的分布每个具体的观察值称为条件频数观察值的分布1.边缘分布n行边缘分布n行观察值的合计数的分布n例如,赞成改革方案的共有279人,反对改革方案的141人n列边缘分布n列观察值的合计数的分布n例如,四个分公司接受调查的人数分别为100人,120人,90人,110人2.条件分布与条件频数n变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布n每个具体的观察值称为条件频数图示:观察值的分布一分公司二分公司三分公司四分公司合计合计赞成该方案6875
6、5779279反对该方案32453331141合合计计10012090110420行边缘分布行边缘分布列边缘分布列边缘分布条件频数条件频数百分比分布(概念要点)1.条件频数反映了数据的分布,但不适合进行对比2.为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布。n行百分比:行的每一个观察频数除以相应的行合计数(fij/ri)n列百分比:列的每一个观察频数除以相应的列合计数(fij/cj)n总百分比:每一个观察值除以观察值的总个数(fij/n)百分比分布(例示)一分公司二分公司三分公司四分公司合计合计赞成该方案24.4%26.9%20.4%28.3%68.0%62.5%63.3571
7、.8%16.2%17.8%13.6%18.8%66.4%反对该方案22.7%31.9%23.4%22.0%32.0%37.5%36.7%28.2%7.6%10.7%7.9%7.4%33.6%合合计计23.8%28.5%21.5%26.2%100%总百分比总百分比总百分比总百分比列百分比列百分比行百分比行百分比概念要点:期望频数1.假定行变量和列变量是独立的2.一个实际频数 fij 的期望频数 eij,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即期望频数的分布一个例子由于观察频数的总数为由于观察频数的总数为n n,所以,所以f f1111 的期望频数的期望频数
8、e e1111 应为应为 例例如如,第第1 1行行和和第第1 1列列的的实实际际频频数数为为 f f1111 ,它它落落在在第第1 1行行的的概概率率估估计计值值为为该该行行的的频频数数之之和和r r1 1除除以以总总频频数数的的个个数数 n n ,即即:r r1 1/n n;它它落落在在第第1 1列列的的概概率率的的估估计计值值为为该该列列的的频频数数之之和和c c1 1除除以以总总频频数数的的个个数数 n n ,即即:c c1 1/n n。根根据据概概率率的的乘法公式,该频数落在第乘法公式,该频数落在第1 1行和第行和第1 1列的概率应为列的概率应为期望频数的分布 一个例子(续)n根据上述
9、公式计算的前例的期望频数一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司赞赞成成该该方案方案实际频实际频数数68755779期望期望频频数数66806073反反对该对该方案方案实际频实际频数数32453331期望期望频频数数344030379.2 拟合优度检验拟合优度检验n9.2.1 统计量n9.2.2 拟合优度检验拟合优度检验皮尔逊拟合优度检验属于非参数检验,是皮尔逊拟合优度检验属于非参数检验,是一种非常重要且简便的非参数检验。它既可用于一种非常重要且简便的非参数检验。它既可用于分布拟合检验,也可用于独立性、样本齐一性等分布拟合检验,也可用于独立性、样本齐一性等检验。检验。9
10、.2.1 统计量1.用于检验列联表中变量之间是否存在显著性差异用于检验列联表中变量之间是否存在显著性差异2.用于检验变量之间是否独立用于检验变量之间是否独立3.用于样本齐一性等检验。用于样本齐一性等检验。4.计算公式为计算公式为一个例子表9-5实际频数实际频数(fij)期望频数期望频数(eij)fij-eij(fij-eij)2(fij-eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合计:合计:合计:合计:3.0319
11、3.0319 统计量的特征1.非负2.与自由度有关3.描述了观测值和期望值之间的接近程度品质数据的假设检验品质数据品质数据比例检验比例检验独立性检验独立性检验Z检验检验一个总体一个总体 检验检验Z检验检验 检验检验两个以上总体两个以上总体两个总体两个总体9.2.2拟合优度检验的应用1列联表中的独立性检验1.检验列联表中目标变量之间是否存在显著性差异2.检验的步骤为n提出假设nH0:P1=P2=Pj (目标变量的各个比例一致)nH1:P1,P2,Pj 不全相等 (各个比例不一致)n计算检验的统计量进行决策:进行决策:根根据据显显著著性性水水平平 和和自自由由度度(r-1)(c-1)(r-1)(c
12、-1)查查出出临临界界值值 2 2。若。若 2 2 2 2,拒绝,拒绝H H0 0;若;若 2 2 2 2,接受,接受H H0 0拟合优度检验的例子(例9.1)1.提出假设nH0:P1=P2=P2 =P4 (赞成比例一致)nH1:P1,P2,P3,P4不全相等 (赞成比例不一致)2.计算检验的统计量【例例例例9.19.1】续续前前例例,检检验验职职工工的的态态度度是是否否与与所所在在单单位位有有关关?(0.10.1)3.3.根根据据显显著著性性水水平平 0.10.1和和自自由由度度(2-1)(4-1)=3(2-1)(4-1)=3查查出出相相应应的的临临界界值值 2 2=6.251=6.251。
13、由由于于 2 2=3.0319=3.0319 2 2=6.251=6.251,不能拒绝,不能拒绝H H0 0,职工的态度与所在单位无关。职工的态度与所在单位无关。9.3拟合优度检验应用小结:独立性检验1.检验列联表中的行变量与列变量之间是否独立2.检验的步骤为n提出假设nH0:行变量与列变量独立nH1:行变量与列变量不独立n计算检验的统计量n n进行决策进行决策l l根据显著性水平根据显著性水平 和自由度和自由度(r r-1)(-1)(c c-1)-1)查出临界值查出临界值 2 2l l若若 2 2 2 2,拒绝,拒绝H H0 0;若;若 2 2 29.448,拒绝H09.4 列联表中的相关测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 chaer 硕士 列联表 拟合 优度非 参数 检验 方法 PPT 课件
限制150内