32独立性检验的基本思想及其初步应用(1).ppt
《32独立性检验的基本思想及其初步应用(1).ppt》由会员分享,可在线阅读,更多相关《32独立性检验的基本思想及其初步应用(1).ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、问题问题: 数学家庞加莱每天都从一家数学家庞加莱每天都从一家面包店买一块面包店买一块1000g 的面包,并记的面包,并记录下买回的面包的实际质量。一年录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据后,这位数学家发现,所记录数据的均值为的均值为950g。于是庞加莱推断这。于是庞加莱推断这家面包店的面包分量不足。家面包店的面包分量不足。 假设假设“面包分量足面包分量足”,则一年购买面包的质量,则一年购买面包的质量数据的平均值应该不少于数据的平均值应该不少于1000g ; “这个平均值不大于这个平均值不大于950g”是一个与假设是一个与假设“面包面包分量足分量足”矛盾的小概率事件;矛盾
2、的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。这个小概率事件的发生使庞加莱得出推断结果。一一: :假设检验问题的原理假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用叫做原假设,用H0表示;另一个叫做备择假设,表示;另一个叫做备择假设,用用H1表示。表示。例如,在前面的例子中,例如,在前面的例子中, 原假设原假设为:为: H0:面包分量足,:面包分量足,备择假设备择假设为为 H1:面包分量不足。:面包分量不足。这个假设检验问题可以表达为:这个假设检验问题可以表达为: H0:面包分量足:面包分量足 H1:面包分量不足:
3、面包分量不足二二: :求解假设检验问题求解假设检验问题考虑假设检验问题:考虑假设检验问题: H0:面包分量足:面包分量足 H1:面包分量不足:面包分量不足1. 在在H0成立的条件下,构造与成立的条件下,构造与H0矛盾的小概矛盾的小概率事件;率事件;2. 如果样本使得这个小概率事件发生,就能如果样本使得这个小概率事件发生,就能以一定把握断言以一定把握断言H1成立;否则,断言没有成立;否则,断言没有发现样本数据与发现样本数据与H0相矛盾的证据。相矛盾的证据。求解思路:求解思路:三三:二个概念二个概念这种变量的不同取这种变量的不同取“值值”表示个体所属的不表示个体所属的不同类别,这类变量称为同类别,
4、这类变量称为分类变量分类变量1.1.分类变量分类变量 对于性别变量,取值为:男、女对于性别变量,取值为:男、女 分类变量分类变量在现实生活中是大量存在的,如是在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。出生月份等等。利用随机变量利用随机变量K K2 2来确定在多大程度上可以认为来确定在多大程度上可以认为”两个分类变量有关系两个分类变量有关系”的方法称为的方法称为两个分类变两个分类变量的独立性检验量的独立性检验.(.(为假设检验的特例为假设检验的特例) ) 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患
5、肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大0.54
6、%0.54%2.28%2.28%1)通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:三维柱三维柱状图状图2) 通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:二维条二维条形图形图3)通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例 独立性检验H H0 0: 吸烟吸烟和和患肺癌患肺癌之间没有关系之间没有关系 H H1 1: 吸烟吸烟和和患患肺癌肺癌之间有关系之间有关系通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可
7、靠结论的可靠程度如何?程度如何? 用用 A A 表示表示“不吸烟不吸烟”, B B 表示表示“不患肺癌不患肺癌”则则 H0: 吸烟和患肺癌之间没有关系 “吸烟吸烟”与与“患肺癌患肺癌”独立独立, ,即即A A与与B B独立独立P(AB)= P(A)P(B)P(AB)= P(A)P(B)等价于等价于等价于等价于 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+da a + + b ba a + + c ca aP P( (A A) ), ,P P( (
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 32 独立性 检验 基本 思想 及其 初步 应用
限制150内