高二数学:1.1《独立性检验(1)》课件苏教.ppt
-
资源ID:78688238
资源大小:278KB
全文页数:16页
- 资源格式: PPT
下载积分:10金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
高二数学:1.1《独立性检验(1)》课件苏教.ppt
1.11.11.11.1 独立性检验独立性检验独立性检验独立性检验2021/8/11 星期三星期三1 某医疗机构为了了解呼吸道疾病与吸某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调烟是否有关,进行了一次抽样调查,共调查了查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人,调查结果是:吸烟的人,调查结果是:吸烟的220220人人中中3737人患人患病病,183183人不患人不患病病;不吸烟的;不吸烟的295295人中人中2121人患人患病病,274274人不患人不患病病。根据这些数据能否断定:患病与根据这些数据能否断定:患病与吸烟有关吗?吸烟有关吗?问题问题:2021/8/11 星期三星期三2患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515问题问题:为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:2222列联表列联表注:什么叫列联表?注:什么叫列联表?2021/8/11 星期三星期三3列联表列联表:列出两个分类变量的频数统计表列出两个分类变量的频数统计表分类变量:变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量.注:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等.性别有两种:性别变量,只取男、女两个值男、女2021/8/11 星期三星期三4患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515问题问题:为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:2222列联表列联表在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 21/295 7.12%21/295 7.12%37/22016.82%37/22016.82%上述结论能说明吸烟与患病有关吗?能有多大把握上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?认为吸烟与患病有关呢?2021/8/11 星期三星期三5患病患病不患病不患病总计总计吸烟吸烟aba+b不吸烟不吸烟cdc+d总计总计a+cb+da+b+c+d如果“吸烟与患病没有关系”,则在吸烟者中不患病的比例应该与不吸烟者中相应的比例差不多,即因此|ad-bc|越小,说明吸烟与患病之间关系越弱;|ad-bc|越大,说明吸烟与患病之间关系越强.为便于研究,用字母代替数据,得为便于研究,用字母代替数据,得22列联表列联表2021/8/11 星期三星期三6患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+a+b+c+d d列出列出2 222列联表列联表 我们不妨作出相反的假设,我们不妨作出相反的假设,H H0 0:吸烟和患病之间没有关系:吸烟和患病之间没有关系 即即H H0 0:P(AB)P(AB)P(A)P(B)P(A)P(B)其中其中A A为某人吸烟,为某人吸烟,B B为某人患病为某人患病 设设n na ab bc cd d 为为样本量样本量 则则P(A)P(A)P(B)P(B)故故P(AB)P(AB)吸烟且患病人数吸烟且患病人数吸烟但未患病人数吸烟但未患病人数不吸烟但患病人数不吸烟但患病人数不吸烟且未患病人数不吸烟且未患病人数2021/8/11 星期三星期三7怎样描述实际观测值与预期值的差异呢?怎样描述实际观测值与预期值的差异呢?统计学中,为度量观测值与预期值的差值统计学中,为度量观测值与预期值的差值皮尔逊(皮尔逊(K.Pearson)引进卡方统计量)引进卡方统计量即即卡尔.皮尔逊英国著名的应用数学家、生物统计学家、优生学家和科学哲学家.若H0成立,即“吸烟与患病没有关系”,则2应很小2021/8/11 星期三星期三8 独立性检验通过公式计算通过公式计算H H0 0:吸烟吸烟和和患病患病之间没有关系之间没有关系解解:患病患病患病患病不患病不患病不患病不患病总计总计总计总计吸烟吸烟吸烟吸烟3737183183220220不吸烟不吸烟不吸烟不吸烟2121274274295295总计总计总计总计5858457457515515这个值是不是很大呢?2021/8/11 星期三星期三9在H0成立的情况下,统计学家估算出如下的概率:H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系”即在H0成立的情况下,的值大于6.635的概率非常小,近似于0.01.P(2x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.8282021/8/11 星期三星期三10 这种利用随机变量这种利用随机变量 来确定在多大程度上来确定在多大程度上可以认为可以认为“两个分类变量有关系两个分类变量有关系”的方法称为两的方法称为两个分类变量的个分类变量的独立性检验独立性检验.独立性检验的思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量 应该很小,如果由观测数据计算得到的 的观测值很大,则在一定程度上说明假设不合理.2021/8/11 星期三星期三11 独立性检验第一步:第一步:H H0 0:吸烟吸烟和和患病患病之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患病有关吸烟与患病有关结论的可靠结论的可靠程度如何?程度如何?患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 222列联表列联表 用用2 2统计量研究统计量研究这类问题的方法这类问题的方法步骤步骤2021/8/11 星期三星期三12第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。P(2x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.8282021/8/11 星期三星期三13P(2x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.706 3.8415.024 6.635 7.87910.8280.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如:2021/8/11 星期三星期三14反证法原理与假设检验原理反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。总结总结:2021/8/11 星期三星期三15课堂练习:课堂练习:书书 P 9 1,2 ,3课堂作业:课堂作业:书书 P 9 1,2 2021/8/11 星期三星期三16