数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用2 新人教A版选修1-2 .ppt
《数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用2 新人教A版选修1-2 .ppt》由会员分享,可在线阅读,更多相关《数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用2 新人教A版选修1-2 .ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.2 独立性检验的基本思想及其初步应用 我们经常听到这些说法:我们经常听到这些说法:l吸烟对患肺癌有影响;吸烟对患肺癌有影响;l数学好的人物理一般也很好;数学好的人物理一般也很好;l性别与是否喜欢数学课程之间有关系;性别与是否喜欢数学课程之间有关系;l人的血型会决定人的性格;人的血型会决定人的性格;l星座与人的命运之间有某种联系;星座与人的命运之间有某种联系;这些说法都有道理吗?这些说法都有道理吗?1.1.理解独立性检验的基本思想理解独立性检验的基本思想.(重点)(重点)2.2.会从列联表、等高条形图直观判断吸烟与患会从列联表、等高条形图直观判断吸烟与患肺癌有关肺癌有关.(难点)(难点)3.
2、3.了解随机变量了解随机变量K K2 2的含义的含义,理解独立性检验的理解独立性检验的基本思想及实施步骤基本思想及实施步骤.(难点)(难点)探究点探究点1 1 独立性检验的基本思想独立性检验的基本思想 对于性别变量,其取值为男和女两种对于性别变量,其取值为男和女两种.这种变量这种变量的不同的不同“值值”表示表示个体所属的不同类别个体所属的不同类别,这样的变,这样的变量称为量称为 .分类变量在现实生活中是大量存在的,如是否分类变量在现实生活中是大量存在的,如是否吸烟、是否患肺癌、宗教信仰、国别、年龄、出生吸烟、是否患肺癌、宗教信仰、国别、年龄、出生月份等月份等.分类变量分类变量 吸烟与患肺癌列联
3、表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965问题:问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了所随机地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是_._.说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大.0.5
4、4%0.54%2.28%2.28%在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是_,_,通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高条形图等高条形图 通过数据和图形分析,得到结论是:吸烟与患通过数据和图形分析,得到结论是:吸烟与患肺癌有关,那么这种判断是否可靠呢?我们可以通肺癌有关,那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题过统计分析回答这个问题.假设假设H H0 0:吸烟与患肺癌之间没有关系吸烟与患肺癌之间没有关系,吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟
5、不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d 如果如果“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”,那么吸烟样,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多例差不多.即即引入一个随机变量引入一个随机变量 它是检验在多大程度上可以认为它是检验在多大程度上可以认为“两个变量有两个变量有关系关系”的标准的标准.ad-ad-bcbc越小,说明吸烟与患肺癌之间的关系越弱,越小,说明吸烟与患肺癌之间的关系越弱,ad-ad-bcbc越大,说明吸烟与患肺癌之间的关系越强越
6、大,说明吸烟与患肺癌之间的关系越强.其中其中n=n=a+b+c+da+b+c+d为样本容量为样本容量.吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965通过公式计算通过公式计算已知在已知在 成立的情况下,成立的情况下,即在即在 成立的情况下,成立的情况下,K K2 2的观测值大于的观测值大于6.6356.635的概率非常小,近似为的概率非常小,近似为0.0100.010,是一个小概率事件,是一个小概率事件.思考:思考:这个值到
7、底告诉我们什么呢?这个值到底告诉我们什么呢?现在现在K K2 2的观测值的观测值k56.632k56.632,远远大于,远远大于6.6356.635,所以有,所以有理由断定理由断定H H0 0不成立,即认为不成立,即认为“吸烟与患肺癌有关系吸烟与患肺癌有关系”.独立性检验的定义独立性检验的定义利用利用随机变量随机变量K K2 2来判断来判断“两个分类变量有关系两个分类变量有关系”的方法称为的方法称为独立性检验独立性检验.独立性检验的一般步骤独立性检验的一般步骤(1 1)假设假设两个分类变量两个分类变量X X与与Y Y没有关系没有关系;(2 2)计算计算出出K K2 2的观测值的观测值k k;(
8、3 3)把)把k k的值的值与临界值比较与临界值比较确定确定X X与与Y Y有关的程度或无有关的程度或无 关系关系.设有两个分类变量设有两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样本频数列联表其样本频数列联表(称为称为2 22 2列联表列联表)为为y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d 如如P(kP(k0 010.828)=0.00110.828)=0.001表示在犯错误的概率表示在犯错误的
9、概率不超过不超过0.0010.001的前提下,认为的前提下,认为“X X与与Y Y有关系有关系”.如如P(kP(k0 06.635)=0.016.635)=0.01表示在犯错误的概率表示在犯错误的概率不超不超过过0.010.01的前提下,认为的前提下,认为“X X与与Y Y有关系有关系”.临界值表:临界值表:0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828独立性检验的
10、基本思想类似反证法独立性检验的基本思想类似反证法(1)(1)假设结论不成立假设结论不成立,即即“两个分类变量没有关系两个分类变量没有关系”.(2)(2)在此假设下随机变量在此假设下随机变量K K2 2应该很小应该很小,如果由观测数据如果由观测数据计算得到计算得到K K2 2的观测值的观测值k k很大很大,则在一定程度上说明假则在一定程度上说明假设不合理设不合理.(3)(3)根据随机变量根据随机变量K K2 2的含义的含义,可以通过评价该假设不合可以通过评价该假设不合理的程度理的程度,如由实际计算出的如由实际计算出的k10.828.k10.828.说明假设不说明假设不合理的程度为合理的程度为99
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用2 新人教A版选修1-2 统计 案例 独立性 检验 基本 思想 及其 初步 应用 新人 选修
链接地址:https://www.taowenge.com/p-97288143.html
限制150内