第3章-定性数据的卡方检验优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第3章-定性数据的卡方检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第3章-定性数据的卡方检验优秀PPT.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、在各个探讨领域中,有些探讨问题只能划分为不同在各个探讨领域中,有些探讨问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、老师、工人、男女,职业分为公务员、老师、工人、,老师,老师职称又分为教授、副教授、职称又分为教授、副教授、。有时虽有量的关。有时虽有量的关系,因探讨须要将其按确定的标准分为不同的类别,系,因探讨须要将其按确定的标准分为不同的类别,例如,学习成果、实力水平、看法等都是连续数据,例如,学习成果、实力水平、看法等都是连续数据,只是探讨者依确定标准将其划分为优良中差,宠爱只是探讨者依确定标准将其划分为优良中
2、差,宠爱与不宠爱等少数几个等级。对这些非连续等距性数与不宠爱等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。关性方法称为计数数据统计方法。机动 书目 上页 下页 返回 结束 H0(无效假设):总体参数没有差别(无效假设):总体参数没有差别机动 书目 上页 下页 返回 结束 2检验检验用途:分类计数资料的假设检验,检验两个或多个用途:分类计数资料的假设检验,检验两个或多个总体率或构成比有无差别。总体率或构成比有无差别。基本思想:实际频数与理论频数的符合程度,即差基本思想:实际频数与理论频数的
3、符合程度,即差别是否由抽样误差引起的。别是否由抽样误差引起的。检验统计量:检验统计量:2用来反映各类中实际观测到的实际频数与确定假用来反映各类中实际观测到的实际频数与确定假设下的理论频数的偏离程度设下的理论频数的偏离程度.恒久是正值恒久是正值.实际频数通过实际观测或试验得到实际频数通过实际观测或试验得到,理论频数要依理论频数要依据统计假设计算出来据统计假设计算出来.第三章第一节第一节机动 书目 上页 下页 返回 结束 卡方拟合性检验第三章第一节第一节机动 书目 上页 下页 返回 结束 卡方拟合性检验一、卡方检验的一般问题一、卡方检验的一般问题卡方检验应用于计数数据的分析,对于总体的分卡方检验应
4、用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的布不作任何假设,因此它又是非参数检验法中的一种。一种。理论证明,实际视察次数(理论证明,实际视察次数(fo)与理论次数()与理论次数(fe),),又称期望次数)之差的平方再除以理论次数所得又称期望次数)之差的平方再除以理论次数所得的统计量,近似听从卡方分布,可表示为:的统计量,近似听从卡方分布,可表示为:机动 书目 上页 下页 返回 结束 K为组数为组数,r为待估参数个数为待估参数个数.n=1n=4n=10f(y)0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1有所变更有所变更.分布的概率
5、密度图形如下:分布的概率密度图形如下:显然显然分布的概率密度图形随自由度的不同而分布的概率密度图形随自由度的不同而当当fe越大(越大(fe5),近似得越好。近似得越好。明显明显fo与与fe相差越大,卡方值就越大;相差越大,卡方值就越大;fo与与fe相差越相差越小,卡方值就越小;因此它能够用来表示小,卡方值就越小;因此它能够用来表示fo与与fe相差相差的程度。的程度。机动 书目 上页 下页 返回 结束 拟合性检验自由度的确定与两个因素有关:一是分拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两
6、者之差即为自由度。约束条件的个数,这两者之差即为自由度。由于一般状况下,计算理论次数时只用到由于一般状况下,计算理论次数时只用到“总数总数”这一统计量,所以自由度一般是分类的项数减这一统计量,所以自由度一般是分类的项数减1。拟合性检验的零假设是观测次数与理论次数之间无拟合性检验的零假设是观测次数与理论次数之间无差异。差异。机动 书目 上页 下页 返回 结束 可认为可认为卡方检验的一般问题是要检验名义型变量的实卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异际观测次数和理论次数分布之间是否存在显著差异。卡方检验能检验单个多项分类名义型变量各分类间的卡方检验能检
7、验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一样的问题,这里实际观测次数与理论次数之间是否一样的问题,这里的观测次数是依据样本数据得到的实计数,理论次数的观测次数是依据样本数据得到的实计数,理论次数则是依据理论或阅历得到的期望次数。这一类检验称则是依据理论或阅历得到的期望次数。这一类检验称为拟合性检验。为拟合性检验。二、检验无差假设二、检验无差假设无差假设无差假设:指各项分类的实计数之间没有差异,也指各项分类的实计数之间没有差异,也就是说各项分类之间的概率相等(匀整分布),就是说各项分类之间的概率相等(匀整分布),因此理论次数完全按概率相等的条件来计算。因此理论次数完全按概
8、率相等的条件来计算。任一项的理论次数都等于任一项的理论次数都等于总数总数/分类项数分类项数。机动 书目 上页 下页 返回 结束 自由度也就等于分类项数减自由度也就等于分类项数减1。例例1 随机地将麻将色子抛掷随机地将麻将色子抛掷300次,检验该色子的次,检验该色子的六个面是否匀整。结果六个面是否匀整。结果1-6点向上的次数依次是,点向上的次数依次是,43,49,56,45,66,41。解解:每个类的理论次数是:每个类的理论次数是 300/6=50,代入公式:,代入公式:机动 书目 上页 下页 返回 结束 因此,在因此,在0.05的显著性水平下,可以说这个色子的六的显著性水平下,可以说这个色子的
9、六面是匀整的。面是匀整的。例例2 随机抽取随机抽取60名高一学生,问他们文理要不要分名高一学生,问他们文理要不要分科,回答赞成的科,回答赞成的39人,反对的人,反对的21人,问对分科的人,问对分科的看法是否有显著的差异。看法是否有显著的差异。解:假如没有显著的差异,则赞成与反对的各占解:假如没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次一半,因此是一个无差假设的检验,于是理论次数为数为60/2=30,代入公式:,代入公式:机动 书目 上页 下页 返回 结束 所以对于文理分科,学生们的看法是有显著的差异的。所以对于文理分科,学生们的看法是有显著的差异的。例例 某商场
10、统计了一周中七天的顾客平均数如下表某商场统计了一周中七天的顾客平均数如下表所示,请问该商场一周各天的顾客数是否有显著所示,请问该商场一周各天的顾客数是否有显著性差异?性差异?机动 书目 上页 下页 返回 结束 星期日星期日星期一星期一星期二星期二星期三星期三星期四星期四星期五星期五星期六星期六顾客数顾客数15000105001180012200132001400018500三、检验假设分布的概率三、检验假设分布的概率 这里的假设分布可以是阅历性的,也可以是某理这里的假设分布可以是阅历性的,也可以是某理论分布。公式中所需的理论次数则依据这里假设论分布。公式中所需的理论次数则依据这里假设的分布进行
11、计算。的分布进行计算。机动 书目 上页 下页 返回 结束 例例3国际色觉障碍探讨会宣布,每国际色觉障碍探讨会宣布,每12个男子中,有个男子中,有一个是先天性色盲。从某校抽取的一个是先天性色盲。从某校抽取的132名男生中有名男生中有4人是色盲,问该校男子色盲比率与上述比例是否人是色盲,问该校男子色盲比率与上述比例是否有显著差异?有显著差异?解:按国际色觉障碍探讨会的统计结果,解:按国际色觉障碍探讨会的统计结果,132人应人应当有当有132/12=11人是色盲,剩下的人是色盲,剩下的121人非色盲,人非色盲,代入公式有:代入公式有:机动 书目 上页 下页 返回 结束 因此,在因此,在0.05和显著
12、性水平下,该校男子色盲比率与国际色和显著性水平下,该校男子色盲比率与国际色觉障碍探讨会的统计结果有显著差异,明显依据比例可知该觉障碍探讨会的统计结果有显著差异,明显依据比例可知该校的色盲率小于国际色觉障碍探讨会的统计结果。校的色盲率小于国际色觉障碍探讨会的统计结果。例例 教务处要求各院系在本科生毕业设计的成果评定教务处要求各院系在本科生毕业设计的成果评定中,留意成果等级的人数分布,一般应符合如下表中,留意成果等级的人数分布,一般应符合如下表格中第一行所示的比例格中第一行所示的比例。某院。某院65名本科生毕业设计名本科生毕业设计成果等级分布如下表其次行数字。请问该院系学生成果等级分布如下表其次行
13、数字。请问该院系学生毕业设计的成果评定是否符合学校要求?毕业设计的成果评定是否符合学校要求?机动 书目 上页 下页 返回 结束 评定等级评定等级优秀优秀良好良好中等中等及格或未及格及格或未及格要求比例要求比例10%50%30%10%某院各等级人数某院各等级人数843131例例4 在英语四级考试中,某学生做对了在英语四级考试中,某学生做对了80个四择一个四择一选择题中的选择题中的28题,现在要推断该生是否是完全凭题,现在要推断该生是否是完全凭揣测做题。揣测做题。解:假如该生完全凭揣测做题,那么平均而言每解:假如该生完全凭揣测做题,那么平均而言每道题做对的可能性是道题做对的可能性是1/4,因此,因
14、此80个题中平均而能个题中平均而能做对做对80/4=20题,代入公式有:题,代入公式有:机动 书目 上页 下页 返回 结束 因此,该生可能会做一些题。因此,该生可能会做一些题。例例5.某电话交换台,在某电话交换台,在100分钟内记录了每分钟被呼分钟内记录了每分钟被呼喊的次数喊的次数X,设,设f i为出现该为出现该 X值的频数,结果如下:值的频数,结果如下:X0 1 2 3 4 5 6 7 8 9f i 0 7 12 18 17 20 13 6 3 4 问总体问总体X(电话交换台每分钟呼唤次数)服从泊松(电话交换台每分钟呼唤次数)服从泊松分布吗?分布吗?解:解:按题意,原假设按题意,原假设 由于
15、由于未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得的估计值:的估计值:检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算:Xf iP inP if i-nP i12345678n=10071218172013671.3099-0.02-0.340.18-2.293.300.95-1.46-0.320.00006 0.0094 0.0018 0.27190.65210.0749 0.2857 0.0140 7.0212.3417.82 19.2916.7012.05 7.467.320.07020.12340.1782 0.19290.16700.1205 0.07
16、460.0732因为因为所以接受所以接受H0,认为电话交换台每分钟呼喊次数认为电话交换台每分钟呼喊次数X 听从泊松分布听从泊松分布.说明说明:将将n=0和和n=1合并,合并,n=8与与n9合并是为了合并是为了保证理论频数保证理论频数npi 4.四、连续变量分布的拟合性检验四、连续变量分布的拟合性检验 首先要将测量数据整理成次数分布表和画出次分首先要将测量数据整理成次数分布表和画出次分布图,并据此选择恰当的理论分布。布图,并据此选择恰当的理论分布。机动 书目 上页 下页 返回 结束 然后依据选择的理论分布计算出理论次数,就可然后依据选择的理论分布计算出理论次数,就可以计算卡方统计量并进行显著性检
17、验了以计算卡方统计量并进行显著性检验了 例例5.为了研究患某种疾病的为了研究患某种疾病的2159岁男子的血压(收岁男子的血压(收缩压,单位:缩压,单位:mm-Hg)这一总体)这一总体X,抽查了,抽查了100个个男子,得男子,得 ,样本值分组如下:,样本值分组如下:序序号号分组分组fi序序号号分组分组fi12345(,99.5)99.5,109.5)109.5,119.5)119.5,129.5)129.5,139.5)582227176789139.5,149.5)149.5,159.5)159.5,169.5)169.5,)9552取取=0.10,检验,检验2159岁男子的血压(收缩压)总岁
18、男子的血压(收缩压)总体体X是否听从正态分布。是否听从正态分布。解:解:按题意,原假设按题意,原假设 由于由于,2未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得其估计值(看教科书七章二节例其估计值(看教科书七章二节例2):):检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算:H0为真时,为真时,列表计算:列表计算:12345678n=10058222717957XfiPinPifi-nPi分组分组(,99.5)99.5,109.5)109.5,119.5)119.5,129.5)129.5,139.5)139.5,149.5)149.5,159.5)159.5,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定性 数据 检验 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内