统计案例高考数学总复习高中数学课时训中学教育高考_中学教育-中学课件.pdf
统计案例 1.对有线性相关关系的两个变量建立的回归直线方程y=a+bx 中,回归系数b与 0 的大小关系为 .(填序号)大于或小于 大于 小于 不小于 答案 2.如果有 90%的把握说事件 A和 B有关系,那么具体计算出的数据2 2.706.(用“”,“”,“=”填空)答案 3.对两个变量 y 与 x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .模型的相关系数 r 为 0.98 模型的相关系数 r 为 0.80 模型的相关系数 r 为 0.50 模型的相关系数 r 为 0.25 答案 4.下列说法中正确的有:若 r0,则 x 增大时,y 也相应增大;若 r0,则 x 增大时,y 也相应增大;若r=1或r=-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 .答案 例 1 (14 分)调查 339 名 50 岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎 未患慢性气管炎 总计 吸烟 43 162 205 不吸烟 13 121 134 合计 56 283 339 试问:(1)吸烟习惯与患慢性气管炎是否有关?(2)用假设检验的思想给予证明.(1)解 根据列联表的数据,得到 2=)()()()(2cdbdcababcadn 2 分=13428356205)1316212143(3392=7.469 6.635 6 分 所以有 99%的把握认为“吸烟与患慢性气管炎有关”.9 分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件 A=26.635 0.01,即 A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有 1%.14 分 例 2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每基础自测 小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速 x(转/秒)16 14 12 8 每小时生产有缺 点的零件数 y(件)11 9 8 5(1)对变量 y 与 x 进行相关性检验;(2)如果 y 与 x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么,机器的运转速度应控制在什么范围内?解 (1)x=12.5,y=8.25,41iiiyx=438,4xy=412.5,412iix=660,412iiy=291,所以 r=)4)(4(42412241241yyxxyxyxiiiiiii=)25.272291()625660(5.412438=25.6565.2562.2550.250.995 4.因为 rr0.05,所以 y 与 x 有很强的线性相关关系.(2)y=0.728 6 x-0.857 1.(3)要使y 100.728 6 x-0.857 1 10,所以 x14.901 3.所以机器的转速应控制在 14.901 3转/秒以下.例 3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求 y关于 x 的回归 方程.使用年数x 1 2 3 4 5 6 7 8 9 10 年均价格 y(美元)2 651 1 943 1 494 1 087 765 538 484 290 226 204 解 作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y 与 x 之间应是非线性相关关系.与已学函数图象于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少比较,用y=eaxb 来刻画题中模型更为合理,令z=lny,则z=bx+a,题中数据变成如下表所示:x 1 2 3 4 5 6 7 8 9 10 z 7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318 相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r-0.996.|r|r0.05.认为x 与z 之间具有线性相关关系,由表中数据得b-0.298,a 8.165,所以z=-0.298x+8.165,最后回代z=lny,即y=e-0.298x+8.165为所求.1.某班主任对全班50 名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作 不太主动参加班级工作 合计 学习积极性高 18 7 25 学习积极性一般 6 19 25 合计 24 26 50(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有 50 种不同的抽查方法,由于积极参加班级工作的学生有 18+6=24人,所以有 24 种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19 人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是 P2=5019.(2)由2统计量的计算公式得2=25252624)761918(50211.538,由于 11.538 10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数 x 之间的一组数据如下:x 3 4 5 6 7 8 9 y 66 69 73 81 89 90 91 于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少已知712iix=280,712iiy=45 309,71iiiyx=3 487,此时 r0.05=0.754.(1)求x,y;(2)判断一周内获纯利润 y 与该周每天销售件数 x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x=71(3+4+5+6+7+8+9)=6,y=71(66+69+73+81+89+90+91)79.86.(2)根据已知712iix=280,712iiy=45 309,71iiiyx=3 487,得相关系数 r=)86.79730945)(67280(86.79674873220.973.由于 0.973 0.754,所以纯利润 y 与每天销售件数 x 之间具有显著线性相关关系.利用已知数据可求得回归直线方程为 y=4.746 x+51.386.3.某种书每册的成本费y(元)与印刷册数 x(千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 检验每册书的成本费 y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出 y 对 x 的回归方程.解 首先作变量置换,令 u=x1,题目所给数据变成如下表所示的 10 对数据:u 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 然后作相关性检验.经计算得 r0.999 8 0.75,从而认为 u 与 y 之间具有线性相关关系.由公式得a 1.125,b8.973,所以y=1.125+8.973 u,最后回代 u=x1,可得y=1.125+x973.8,这就是题目要求的 y 对 x 的回归曲线方程.回归曲线的图形如图所示,它是经过平移的反比例函数图象的一个分支.于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少一、填空题 1.对于独立性检验,下列说法中正确的是 .2的值越大,说明两事件相关程度越大 2的值越小,说明两事件相关程度越小 22.706 时,有 90%的把握说事件 A与 B无关 26.635 时,有 99%的把握说事件 A与 B有关 答案 2.工人月工资 y(元)依劳动生产率 x(千元)变化的回归方程为y=50+80 x,下列判断正确的是 .劳动生产率为 1 000 元时,工资为 130 元 劳动生产率提高 1 000 元时,工资平均提高 80 元 劳动生产率提高 1 000 元时,工资平均提高 130 元 当月工资为 210 元时,劳动生产率为 2 000 元 答案 3.下面是 22 列联表:y1 y 2 合计 x1 a 21 73 x2 22 25 47 合计 b 46 120 则表中 a,b 的值分别为 .答案 52,74 4.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则 y 与 x 之间的回归直线方程为 .答案 y=x+1 5.在一次试验中,当变量x 的取值分别为 1,21,31,41时,变量 y 的值分别为 2,3,4,5,则 y 与x1的回归曲线方程为 .答案 y=x1+1 6.在一次对性别与说谎是否有关的调查中,得到如下数据:说谎 不说谎 合计 男 6 7 13 女 8 9 17 合计 14 16 30 根据表中数据,得到如下结论中不正确的是 .在此次调查中有 95%的把握认为是否说谎与性别有关 在此次调查中有 99%的把握认为是否说谎与性别有关 在此次调查中有 99.5%的把握认为是否说谎与性别有关 在此次调查中没有充分的证据显示说谎与性别有关 答案 于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50 名学生,得到如下 22 列联表:理科 文科 男 13 10 女 7 20 已知 P(23.841)0.05,P(25.024)0.025.根据表中数据,得到2=30202723)7102013(5024.844.则认为选修文科与性别有关系出错的可能性为 .答案 5%8.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后 14 天的结果如下表所示:死亡 存活 合计 第一种剂量 14 11 25 第二种剂量 6 19 25 合计 20 30 50 进行统计分析时的统计假设是:.答案 小白鼠的死亡与剂量无关 二、解答题 9.在一次飞机航程中调查男女乘客的晕机情况,其二维条形图如图:(1)写出 22 列联表;(2)判断晕机与性别是否有关?解 (1)晕机 不晕机 合计 男 10 70 80 女 10 20 30 合计 20 90 110(2)2=80309020)10702010(11026.366 5.024,故有 97.5%的把握认为“晕机与性别有关”.10.某地 10 户家庭的年收入和年饮食支出的统计资料如下表:年收入 x(万元)2 4 4 6 6 6 7 7 8 10 年饮食支出 y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(1)根据表中数据,确定家庭的年收入和年饮食支出之间是否具有相关关系;若具有相关关系求出 y与 x 的回归直线 方程;(2)如果某家庭年收入为 9 万元,预测其年饮食支出.解 (1)由题意知,年收入 x 为解释变量,年饮食支出 y 为预报变量,作散点图(如图所示).从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用回归直线方程刻画它们之间的关系.于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少x=6,y=1.83,1012iix=406,1012iiy=35.13,101iiiyx=117.7,b0.172,a=y-bx=1.83-0.172 6=0.798.从而得到回归直线方程为y=0.172 x+0.798.(2)当 x=9 时,y=2.346.因此,某家庭年收入 9 万元,其年饮食支出大约为 2.346 万元.11.测得某国家 10 对父子身高(单位:英寸)如下:父亲身高(x)60 62 64 65 66 67 68 70 72 74 儿子身高(y)63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70(1)对变量 y 与 x 进行相关性检验;(2)如果 y 与 x 之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为 73 英寸,估计儿子的身高.解 (1)x=66.8,y=67.01,1012iix=44 794,1012iiy=44 941.93,xy=4 476.268,2x=4 462.24,2y4 490.34,101iiiyx=44 842.4.所以 r=)10)(10(102101221012101yyxxyxyxiiiiiii=)4.9034493.94144)(4.6224479444(27.4764104.84244=748.611672.790.980 4.因为 rr0.05,所以 y 与 x 之间具有线性相关关系.(2)设回归直线方程为axby.由b210121011010 xxyxyxiiiii=4.62244794447.762444.84244=6.17172.790.464 6.于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少xbya=67.01-0.464 6 66.8 35.974 7.故所求的回归直线方程为y=0.464 6 x+35.974 7.(3)当 x=73 英寸时,y=0.464 6 73+35.974 7 69.9,所以当父亲身高为 73 英寸时,估计儿子的身高约为 69.9 英寸.12.在调查的 480 名男人中有 38 名患有色盲,520 名女人中有 6 名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?解 根据题目所给的数据作出如下的列联表:色盲 不色盲 合计 男 38 442 480 女 6 514 520 合计 44 956 1 000 根据列联表作出相应的二维条形图:从二维条形图来看,在男人中患色盲的比例为48038,要比女人中患色盲的比例5206大.其差值为5206480380.068,差值较大.因而,我们可以认为“患色盲与性别是有关的”.根据列联表所给的数据可以有 a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1 000,由2=)()()()(2dbcadcbabcadn=95644520480)442651438(0001227.1.由 27.1 10.828,所以我们有 99.9%的把握认为患色盲与性别有关系,这个结论只对所调查的 480 名男人和 520 名女人有效.于大于小于不小于答案如果有的把握说事件和有关系那么具体计算出的数据用填空答案对两个变量与进行回归分析分别选择不同的模型它们的相关系数如下其中拟合效果最好的模型是模型的相关系数为模型的相关系数为模型的相关完全对应有函数关系在散点图上各个点均在一条直线上答案例分调查名岁以上人的吸烟习惯与患慢性气管炎的情况数据如下患慢性气管炎未患慢性气管炎吸烟不吸烟合计试问吸烟习惯与患慢性气管炎是否有关用假设检验的思想给予炎之间没有关系由于事件即为小概率事件而小概率事件发生了进而得假设错误这种推断出错的可能性约有分例一台机器使用时间较长但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点每小时生产有缺点零件的多少