贾俊平统计学第五版第9章分类数据分析.ppt
《贾俊平统计学第五版第9章分类数据分析.ppt》由会员分享,可在线阅读,更多相关《贾俊平统计学第五版第9章分类数据分析.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、9-1统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院第第 9 章章 分类数据分析分类数据分析作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学9-2统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院第第 9 章章 分类数据分析分类数据分析9.1 分类数据与分类数据与 2统计量统计量 9.2 拟合优度拟合优度 检验检验9.3 列联分析:独立性检验列联分析:独立性检验9.4 列联分析中应注意的问题列联分析中应注意的问题9-3统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院学习目
2、标学习目标1.理解分类数据与理解分类数据与 2 统计量统计量2.掌握拟合优度检验及其应用掌握拟合优度检验及其应用3.掌握独立性检验及其应用掌握独立性检验及其应用4.掌握测度列联表中的相关性掌握测度列联表中的相关性9-4统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院9.1 分类数据与列联表分类数据与列联表9.1.1 分类数据分类数据9.1.2 2统计量统计量9-5统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院分类数据分类数据9-6统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院分类数据分类数
3、据1.分类变量的结果表现为类别n n例如:性别例如:性别 (男男,女女)2.各类别用符号或数字代码来测度3.使用分类或顺序尺度n n你吸烟吗你吸烟吗?l l1.1.是;是;2.2.否否n n你赞成还是反对这一改革方案你赞成还是反对这一改革方案?l l1.1.赞成;赞成;2.2.反对反对4.对分类数据的描述和分析通常使用列联表5.可使用检验9-7统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院 统计量统计量9-8统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院 统计量统计量1.1.用于检验分类变量拟合优度用于检验分类变量拟合优度
4、2.2.计算公式为计算公式为9-9统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院 统计量统计量分布与自由度的关系分布与自由度的关系 9-10统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院9.2 拟合优度拟合优度检验检验9-11统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院拟合优度检验拟合优度检验(例题分析例题分析)【例例】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性
5、344人,以的显著性水平检验存活状况与性别是否有关。(0.05)9-12统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院拟合优度检验拟合优度检验(例题分析例题分析)解:解:要回答观察频数与期望频数是否一致,检验如下假设:H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致9-13统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院拟合优度检验拟合优度检验(例题分析例题分析)自由度的计算为df=R-1,R为分类变量类型的个数。在本例中,分类变量是性别,有男女两个类别,故R=2,于是自由度df=2-1=1,经查分布表,(0.1
6、)(1)=2.706,故拒绝H0,说明存活状况与性别显著相关9-14统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院9.3 列联分析:独立性检验列联分析:独立性检验 9.3.1 列联表列联表9.3.2 独立性检验独立性检验9-15统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院列联表列联表(contingency table)1.由两个以上的变量交叉分类的频数分布表2.行变量的类别用 r 表示,ri 表示第 i 个类别3.列变量的类别用 c 表示,cj 表示第 j 个类别4.每种组合的观察频数用 fij 表示5.表中列出了行变
7、量和列变量的所有可能的组合,所以称为列联表6.一个 r 行 c 列的列联表称为 r c 列联表9-16统计学统计学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院列联表的结构列联表的结构(r c 列联表的一般表示列联表的一般表示)列列列列(c cj j)合计合计合计合计j j=1=1j j=2 2i i=1=1f11f12r1i i=2=2f21f22r2:合合合合计计计计c1c2n列列列列(c cj j)行行行行(r ri i)f fij ij 表示第表示第表示第表示第 i i 行第行第行第行第 j j 列的观察频数列的观察频数列的观察频数列的观察频数9-17统计学统计
8、学STATISTICS(第五版第五版)作者:贾俊平,中国人民大学统计学院独立性检验独立性检验(例题分析例题分析)【例例例例】一一种种原原料料来来自自三三个个不不同同的的地地区区,原原料料质质量量被被分分成成三三个个不不同同等等级级。从从这这批批原原料料中中随随机机抽抽取取500500件件进进行行检检验验,结结果果如如表表9-39-3所所示示,要要求求检检验验各各个个地地区区和和原原料料质质量量之之间间是是否否存存在在依依赖赖关关系系?(0.05)0.05)解:解:H H0 0:地区和原料等级之间是独立的(不存在依赖关系):地区和原料等级之间是独立的(不存在依赖关系)H H1 1:地区和原料等级
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贾俊平 统计学 第五 分类 数据 分析
限制150内