【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3).ppt
《【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3).ppt》由会员分享,可在线阅读,更多相关《【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3).ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.2独立性检验的独立性检验的基本思想及其初基本思想及其初步应用步应用2 2定量变量回归分析(画散点图、相关系数r、定量变量回归分析(画散点图、相关系数r、变量 相关指数R 、残差分析)变量 相关指数R 、残差分析)分类变量分类变量研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变
2、量之间是否有关系分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。性别是否对于喜欢数学课程有影响?等等。变量的不同变量的不同”值值”表示个体所属的不同类别表示个体所属的不同类别.分类变量:如:性别,是否吸烟,宗教信仰,国籍等在日常生活中,我们常常关心两个分类变量之间是否具有关系.例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计
3、9874919965列联表列联表:列出两个分类变量的频数表列出两个分类变量的频数表那么吸烟是否对患肺癌有影响?粗略估计:在不吸烟者中,有0.54%患有肺癌;在吸烟者中,有2.28%患有肺癌.因此,直观上得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异因此因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。越大,说明吸烟与患肺癌之间关系越强。不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+dadbc即aa+ba+caa+ba+cnnnnnna+ba
4、+bP(A),P(A),n na+ca+cP(B),P(B),n n.a aP(AB)P(AB)n n其中为样本容量,即n = a+b+c+dn = a+b+c+d在表中,在表中,a恰好为事件恰好为事件AB发生的频数;发生的频数;a+b和和a+c恰好分别为事恰好分别为事件件A和和B发生的频数。由于频率接近于概率,所以在发生的频数。由于频率接近于概率,所以在H0成立的条成立的条件下应该有件下应该有(a+b+c+d)a(a+b)(a+c),怎样描述实际观测值与估计值的差异呢?怎样描述实际观测值与估计值的差异呢?统计学中采用统计学中采用22()abacannnKabacnnn ndbnbanndbn
5、banb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)(22()()()()()n adbcac bdab cd化简得K2(K 2 2观观测测值值预预期期值值) )用用卡卡方方统统计计量量: :预预期期值值来来刻刻画画实实际际观观测测值值与与估估计计值值的的差差异异. .即即 独立性检验第一步:第一步:H H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患病有关吸烟与患病有关结论的可靠结论的可靠程度如何?程度如何? 患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸
6、烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列联表列联表 用用2 2统计量研究统计量研究这类问题的方法这类问题的方法步骤步骤第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。dcban其中 22na db cKabcdacbdP(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.8
7、79 10.828P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828210.828K 26.635K 22.706K 22.706K 0.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为
8、把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如 独立性检验通过公式计算通过公式计算患病患病不患病不患病总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965229965 7775 4942 209956.6327817 2148 9874 91KH H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系解解:已知在已知在 成立的情况下,成立的情况下,0H故有故有99.9%99.9%的把握
9、认为的把握认为H H0 0不成立,即有不成立,即有99.9%99.9%的把握认为的把握认为“患病与吸烟有关系患病与吸烟有关系”。即在即在 成立的情况下,成立的情况下, 大于大于10.82810.828概率非常概率非常小,近似为小,近似为0.0010.0010H2K现在的现在的 =56.632=56.632的观测值远大于的观测值远大于10.82810.828,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0010.001。2K2(1 0 .8 2 8)0 .0 0 1PK0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 独立性的基本思想及其初步应用 32 独立性 基本 思想 及其 初步 应用 PPT 课件 新人 选修
限制150内