第九讲 卡方检验精选PPT.ppt





《第九讲 卡方检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第九讲 卡方检验精选PPT.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九讲 卡方检验第1页,本讲稿共87页一、一、检验的功能检验的功能检验的功能检验的功能1、适用资料计数数据 计数数据的统计分析,测量数据的统计 方法并不适用,卡方检验是较为常用的一 种方法。第2页,本讲稿共87页拟合优度检验例 即通过实际调查与观察所得到的一批 数据,其次数分布是否服从理论上所假 定的某一概率分布;2、卡方检验的功能第3页,本讲稿共87页例 某广播电视台为了了解广大儿童对其提供的6种儿童节目的偏好(态度),随机抽取了300名儿童,问他们最喜欢哪一种节目(每人只能选一种),得到的数据如下表:节目1节目2 节目3节目4 节目5 节目6858055 104030问:问:就调查的300
2、人而言,他们对6个节目的 偏好(体现在人数)是否存在显著的差 异?第4页,本讲稿共87页第5页,本讲稿共87页变量间的独立性检验变量间的独立性检验 在对一批观察数据进行双向多项分类之后,这两个分类特征是独立无关的还是具有连带相关的关系?第6页,本讲稿共87页例 某师范大学为了了解广大师生对实行“中期选拨”制度的态度。曾以问卷调查的形式对977名低年级学生、790名高年级学生和764名教师进行随机调查,调查结果:第7页,本讲稿共87页 主要用于检验不同人群母总体在某一个变量上的反应是否有显著差异。例从四所幼儿园分别随机抽出6 岁儿童若 干,各自组成一个实验组,进行识记测 验。测验材料是红、绿、蓝
3、三种颜色书 写的字母,以单位时间内的识记数量为 指标,结果如下。问四组数据是否可以 合并分析。同质性检验第8页,本讲稿共87页 分组 红色字母 绿色字母 蓝色字母1 24 17 192 15 12 93 20 20 144 10 25 28第9页,本讲稿共87页 理论基础是1899年皮尔逊的工作:在分布拟合优度检验中,实际观察次数 与理论次数 之差的平方除以理论次数近似服从 分布,即:二、检验的基本原理第10页,本讲稿共87页-如果实际观察次数与理论次数的差异越 大,卡方检验的结果就越可能拒绝无差 虚无)假设接受备择假设。-理论次数 越大()拟合效果 越 好。注第11页,本讲稿共87页注 K
4、为类别的数目;是实际观察值;是理论(期待)次数;是约束条件数或利用观察数据时使 用的样本统计量的数目;1、卡方检验基本公式第12页,本讲稿共87页分类相互排斥,互不包容;观察值相互独立;期望次数的大小应大于或等于5(较好趋 近卡方分布的前提);2、卡方检验的假设第13页,本讲稿共87页自由度小时,必须 ,否则利用卡方 检验需要进行较正或用精确的分布 进行 检验;自由度大时,可以有少许类别的理论次 数少于5;应用卡方检验时,应注意取样设计,保 证取样的代表性,否则依据卡方检验的 结果难以保证结论的科学性;注第14页,本讲稿共87页 由于检验内容仅涉及一个变量多项分类的计数资料,也称one-way
5、 test)1、配合度检验的一般问题 即检验实际观察数据的分布与某理 论分布是否有显著的差别。三、卡方检验应用一总体分布的拟合检 验(goodness of fit test 配合度检验)第15页,本讲稿共87页统计假设 2、检验过程即:实际观察次数与某分布理论次数之间无差异;第16页,本讲稿共87页依统计检验公式,计算实得卡方值数理基础作出统计决断N:总数Pe:具体类别理论概率第17页,本讲稿共87页例 某项民意测验,答案有同意、不置可否、不同意3种。调查了48人,结果同意的24人 ,不置可否的人12人,不同意的12人,问持 这3种意见的人数是否存在显著差异?3、离散型分布的拟合检验第18页
6、,本讲稿共87页 对于连续随机变量的测量数据,有时不知道其总体分布,需要根据样本的次数分布的信息判断其是否服从某种确定的连续性分布。检验方法 将连续性的测量数据整理成次数分布表 画出相应的次数分布曲线;选择恰当的理论分布;进行拟合检验;4、连续型分布拟合检验(例)第19页,本讲稿共87页例:下表是552名学生的身高次数分布,问这 些学生的身高分布是否符合正态分布?第20页,本讲稿共87页169 170 2 15.38 3.03 0.00237 1 166 167 7 12.38 2.44 0.01201 7163 164 22 9.38 1.85 0.04260 24 0.167160 161
7、 57 6.38 1.26 0.10888 60 0.150157 158 110 3.38 0.67 0.18858 104 0.471154 155 124 0.38 0.07 0.23544 130 0.277151 152 112 -2.62 -0.52 0.20615 114 0.035 148 149 80 -5.62 -1.11 0.12746 70 1.429145 146 25 -8.62 -1.70 0.05562 31 1.161142 143 8 -11.62 -2.29 0.01710 9 139 140 4 -14.62 -2.88 0.00396 2身高 组中值
8、次数 离均差 Z分数 P 理论次数0.1250.09第21页,本讲稿共87页其一、分组数据第1组理论次数的计算 注:=组上限的Z值-组下限的Z值其二、拟合指标卡方值的计算分析第22页,本讲稿共87页5、二项分类的配合度检验与比率显著检验设总体比率为 ,且 时第23页,本讲稿共87页结论:Z检验与卡方检验一致 (样本比率p的真正分布是二项分布)第24页,本讲稿共87页 男 生 女 生 某班有100名学生,男生的有42人,问男生的比率是否与0.5有显著差异?比率显著性检验 42 58 50 50例用卡方检验(配合度)第25页,本讲稿共87页当 且 时卡方检验公式第26页,本讲稿共87页 当期望次数
9、小于5时,卡方检验需要校正,Yates建议的校正公式为:注:校正后的结果与二项分布的结果一致 的连续性校正(二项分类数据或比率)第27页,本讲稿共87页1、功能(例)主要通过对两个或两个以上因素多项分 类的计数资料的分析,以研究两变量或多 个变量之间的关联性与依存性。四、独立性检验(四、独立性检验(test of independencetest of independence)第28页,本讲稿共87页 独立性检验一般多采用表格的形式记录观察结果的计数资料,这种表格即列联表。RK 型列联表(二个因素:一个因素有R个分类,另一有K个分类)2、一个术语-列联表第29页,本讲稿共87页RK RK 型
10、列联表一般型列联表一般数据数据结构示意图结构示意图因素A因素BA1 A2 .Aj ARB1B2BiBk第30页,本讲稿共87页统计假设 二因素或多因素之间是独立;(数据)理论次数的计算3、独立性检验的一般问题与步骤自由度的确定第31页,本讲稿共87页卡方检验(公式1)统计推断拒绝假设接受假设第32页,本讲稿共87页RC的卡方检验,允许有的格内的实计数 为0,最小的理论次数为0.5;RC 的卡方检验中最小的理论次数小于 0.5 或1(2 C列联表),一般采用合并 项目的方法,而不用连续性校正公式;注第33页,本讲稿共87页 检验公式(各单元格理论次数5)自由度因 素 A 分类1 分类2 因 素B
11、分类1 分类2ABCD4、独立样本四格表 检验(列联表特例)第34页,本讲稿共87页注:独立样本四格表 检验相当于独立样本 比率差异的显著性检验。第35页,本讲稿共87页 随机抽取90名学生,将学生按性别与学习成绩进行分类,结果如下表,问男女大学生在学业成绩上是否有关联?或男女学生在成绩中等以上的比率是否存在显著差异?学 业 水 平中等以上 中等以下 性别 男 女23172822例第36页,本讲稿共87页Fisher精确概率检验(略)检验校正公式 5、四格表中若有单元格理论次数5第37页,本讲稿共87页适用范围 分类变量数目多于2个 例:讨论性别(男、女)、婚姻(未 婚、已婚)及生活满意状况(
12、刺 激、规律、无聊)之间的关系。6、多重列联表分析第38页,本讲稿共87页确定控制变量(分层变量)例性别分别对在控制变量的每一水平下的另两个 变量形成的列联表进行分析;例 *男性婚姻状况与生活满意状态关联分析 *女性婚姻状况与生活满意状态关联分析多重列联表的分析第39页,本讲稿共87页对于控制变量的不同水平所进行的单个列联 表分析 、如果 值不显著,此时可以将各个水 平下的 值相加,以推测列联表中两 个变量总的 值,并进行关联性检定。第40页,本讲稿共87页、当控制变量各水平不一致时,必须单独就 个别关联表进行分析。第41页,本讲稿共87页例 某通讯公司想了解大学生最喜欢的手机品 牌,随机抽取
13、了72名大学生,调查性别、家庭经济水平以及最喜欢的手机品牌,来 探讨这三个变量之间的关系,调查结果如 下表。第42页,本讲稿共87页甲 乙 丙经 济 水 平低高甲 乙 丙手机品牌性 男别 女13 2 3 4 12 49 3 7 8 5 2第43页,本讲稿共87页1、同质性检验(test for homogeneity)几个不同的因素之间是否有实质差异 判断几次重复实验的结果是否同质 单因素分类数据的同质性检验 样例四、同质性检验与数据的合并第44页,本讲稿共87页、计算各个样本组的 值和自由度;、累加各样本组 值,计算其总和及自由 度的总和;、将各个样本组原始数据按相应类合并,产生一个总的数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九讲 卡方检验精选PPT 第九 检验 精选 PPT

限制150内