《2023年精品讲义第一章统计案例复习.pdf》由会员分享,可在线阅读,更多相关《2023年精品讲义第一章统计案例复习.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习必备 欢迎下载 第一章统计案例复习稿件 授课教师:王宏 郭懿 一、复习导言 本章主要内容独立性检验的思想与回归分析的应用,主要通过案例体会运用统计方法解决实际问题的思想与方法。统计案例是实用性很强的知识,以统计案例为背景命题应用性试题,考查基础知识和基本方法的同时,考查运用所学知识解决实际问题的能力,还体现以知识为依托,突出对思想方法的考查。所以高考要注意统计应用问题的考查。二、要求 1、通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用,会用判断线性回归模型的拟合效果。2、理解独立性检验的基本思想,掌握假设检验的思想在独立性检验中的应用,能解决一些统计案例。三、要点精析(一)
2、回归分析 1、回归分析是处理变量之间_的一种统计方法,若两个变量之间具有线性相关 关系,则称相应的回归分析为线性回归分析。2、线性回归方程_,其中niiniiixxyyxxb121)()(niiniiixnxyxnyx1221,xbya称为回归系数,_称为样本的中心点,回归直线经过样本点的中心。【答案】1.相关关系;2.axby;),(yx(二)相关关系与相关检验 1、相关关系是非随机变量与随机变量之间的关系,如人的身高与年龄,商品的销售额 与广告费等关系都是相关关系,它是一种_,而不是函数关系。2、样本相关系数:用来对变量 x 与 Y 作相关性检验的统计量,用 r 来表示。r=_.3、r 的
3、性质:具有相关关系的两个变量之间关系的强弱是通过相关系数来衡量的,当 r0 时,表明两个变量_;当 r3.841,则有_的把握说事件 A与 B有关;若2K6.635,则有_的把握说事件 A与 B有关;若841.32K,认为事件 A与 B无关。【答案】:1.独立性检验;三维柱形图和二维条形图;baa;2.)()()()()(2dcbandcdbcababcadnk 3.95%;99%。四、题型解析 类型一 线性回归方程的实际应用 背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识
4、和解为程其本中?学习必备 欢迎下载 例 1 在某化学试验中,测得如下表所示的 6 组数据,其中 x(min)表示化学反应进 行的时间,y(mg)表示未转化的物质的量 x/min 1 2 3 4 5 6 y/mg 39.8 32.2 25.4 20.3 16.2 13.3 (1)设 y 与 x 之间具有关系xcdy,试根据测量数据估计 c 和 d 的值;(2)估计化学反应进行到 10min 时未转化的物质的量。解:(1)在xcdy 的两边取自然对数,可以得到 lny=lnc+xlnd,设 lny=z,lnc=a,lnd=b,则 z=a+bx,又由已知数据可以得到下表:x/min 1 2 3 4
5、5 6 y/mg 39.8 32.2 25.4 20.3 16.2 13.3 z=lny 3.684 3.472 3.235 3.011 2.785 2.588 由 公 式 得2 2 1 9.0,9 0 5 8.3ba,z关 于x的 线 性 回 归 方 程 为xz2219.09058.3,即2219.0ln,9058.3lndc,所以8010.0,6898.49dc,根据测量数据估计 c=49.6898,d=0.8010.(2)由(1)知 y 与 x 之间的关系为xy8010.06898.49,当 x=10 时,4.58010.06898.910y,所以当化学反应进行到 10min 时,未转化
6、的物质的量为 5.4mg.点评:在实际问题中,有时两个变量之间并不是线性相关关系,这就需要我们根据已有的知识或散点图选择适当的曲线方程,然后通过适当的变量代换,把非线性问题转化为线性回归问题,从而确定未知参数,建立相应的回归方程。类型二 独立性检验的应用 例 2 在国家实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取 1000 人 作问卷调查,只有 80 人志愿加入西部建设,而国家公布实施西部开发战略后,随机抽取 1200 名应届大学毕业生作问卷调查,有 400 人志愿加入国家西部建设。问实施西部开发战略的公布是否对应届大学毕业生的选择产生影响?分析:本题是一道信息题,独立性检验在应用
7、于很大领域时需要通过建立模型实现信息迁移,即将信息转化为 22 列联表形式,再通过计算2K统计量得出相应的结论。解:根据题意,列出 22 列联表,如下:自愿者 非志愿者 总计 西部开发战略公布前 80 920 1000 西部开发战略公布后 400 800 1200 背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识和解为程其本中?学习必备 欢迎下载 总计 480 1720 2200 由公式计算2K统计量得:22.205120010001720480)40092080080(22
8、0022K,因为 205.226.635,所以有 99%的把握认为实数西部开发战略的公布对应届大学毕业生的选择产生了影响。点评:即使不进行独立性检验,我们也能正确判断出“开发战略“起了作用,但利用2K统计量所得结果更具有说服力,还可以说明西部开发战略具有很大的带动作用。例 3、某同学对一些人进行了喜爱运动与身体健康的关系的调查,在填写列联表时,不 慎写错了几个数据,他一气之下将写错的数全都涂掉了,残表如下:喜爱运动 不喜爱运动 总计 身体健康 30 A 50 身体不健康 B 10 60 总计 C D E 请问借助这个残表能判断出运动与身体健康有关吗?解:根据列联表的特点,由 30+A=50得
9、A=20,B+10=60得 B=50,30+B=C 因此 C=80,A+10=D得 D=30,又 C+D=E,得 E=110.即完整的列联表如下:喜爱运动 不喜爱运动 总计 身体健康 30 20 50 身体不健康 50 10 60 总计 80 30 110 由于635.6486.730806050)20501030(11022,所以借助这个列表我们有 99%的把握认为喜爱运河与身体健康有关。点评:本题考查列联表的性质(即列联表中各数据之间的关系),虽然本题不难,但考查的方式及命题角度值得我们重视。类型三 创新探索性问题 例 4、有两个分类变量 X与 Y,其一组观测值如下面的 22 列联表所示:
10、1y 2y 1x a 20-a 2x 15-a 30+a 其中,a,15-a 均为大于 5 的整数,则 a 取何值时,有 90%的把握认为“X与 Y之间有 背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识和解为程其本中?学习必备 欢迎下载 关系”?分析:要有 90%的把握认为“X与 Y之间有关系“,需要检测随机变量2K的观测值 大于 2.706,故所求得2K的观测值后解不等式即可。解:要有 90%的把握认为“X与 Y之间有关系“,需要随机变量2K的观测值 大于 2.706,因
11、为 a+(20-a)=20,(15-a)+(30+a)=45,a+(15-a)=15,(20-a)+(30+a)=50,a+(20-a)+(15-a)+(30+a)=65,则 706.25400)6013(1350154520)15)(20()30(6522aaaaak,解之可得 a7.19或 a5 且 15-a5,Za,即 a=6,7,8,9 故当 a=8 或 9 时,有 90%的把握认为 X与 Y之间有关系。点评:本题是已知2K的范围逆向求 a,注意还要考虑 a 的可能取值,也可以先得出 a 的四个可能取值,再代入求2K来验证找出满足要求的 a 的值。类型四 综合交汇以及图表信息题 例5.
12、某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表所示:若单科成绩85分以上(含85分),则该科成绩为优秀(1)根据上表完成下面的22列联表(译位:人):(2)根据题(1)中表格的数据计算,有多大的把握,认为学生的数学成绩与物理成绩 之间有关系?分析:通过认识图表、填写图表,把问题转化为 22 列联表独立性检验问题。利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间没有关系,再计算2K的值,如果2K的值越大,说明两个变量之间有关系的可能性也就越大,再参考临界值,从而判断两个变量有关系的可信程度。解析:(1):22
13、列联表为(单位:人)背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识和解为程其本中?学习必备 欢迎下载 (2)解:提出假设 H0:学生数学成绩与物理成绩之间没有关系:根据列联表可以求得:879.7802.8137146)21125(2022K,当 H0成立时,P(K005.0)879.72,所以我们有 99.5%的把握认为:学生的数学成绩与物理成绩之间有关系。点评:在利用统计变量2K进行独立性检验时,应该注意准确代数和正确计算,再把计算的结果与有关临界值相比较,正确下结论。例
14、 6.某体育训练队共有队员40 人,下表为跳高、跳远成绩的分布表,成绩分为 15 个档次,例如表中所示跳高成绩为 4 分,跳远成绩为 2 分的队员有 5人。将全部队员的姓名卡混合在一起,任取一张,该卡队员的跳高成绩为 x,跳远成绩为 y,设 x,y 为随机变量(注:没有相同姓名的队员)y x 跳 远 5 4 3 2 1 跳 高 5 1 3 1 0 1 4 1 0 2 5 1 3 2 1 0 4 3 2 1 1 6 0 3 1 0 0 1 1 3(1)求 x4 的概率及 x4 且3y的概率;(2)若跳远、跳高成绩相等时的人数分别为 c,d,试问:c,d 是否具有线性相关关系?若有,求出回归直线方
15、程;若没有,请说明理由。分析:本题是图表信息题,通过阅读图表、绘制图表解决实际问题,能够体现统计的重要思想,即数据处理能力。解:(1)由于队员总数为 40,当 x4 时,即跳高成绩为 4 分时的队员共 9人,于是,x4 的概率为4091P;x4 且3y时,即跳高成绩为 4 分,跳远成绩不低于 3 分的队员共有 3 人,于是,x4 且3y的概率为.4032P(2)将跳远、跳高成绩及人数整理如下表:成绩 5 4 3 2 1 跳远 c 5 5 10 10 10 跳高 d 6 9 10 10 5 背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题
16、断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识和解为程其本中?学习必备 欢迎下载 易得8,8 dc,30)(12niicc,22)(12niidd,5)()(1ddccinii,那么1946.022305)()()()(11221niniiiiniiddccddccr,可见变量 d 与 c 不具有线性相关性。点评:本题的第一问是古典概型,第二问是线性回归。本题将这两个内容恰到好处的融为一体。五、备考策略 1.统计的基本思维模式是归纳的,它的特征之一是通过部分数据来推测全体数据的性质,因此,统计推断是可能犯错误的,也就是说,我们从数据上体现的只是统计上的关系,而不是因果关系。独立
17、性检验的基本思想类似于反证法,为了探求事件 A与 B是否有关,首先列出事 件 A与 B的 22 列联表,利用公式计算出统计量2K,将2K的数值与两个临界值 3.841 与 6.635 进行对比,然后作出统计推断。利用 22 列联表,不仅能考查两个变量之间是否有关,而且还能较精确地给出这种判断的可靠性程度。因此,独立性检验在生物统计、医学统计、处理社会问题调查数据等方面有着广泛的应用。2、两个变量之间除了确定性的函数关系外,还大量存在着因变量的取值带有一定随机性的相关关系,回归分析就是寻找相关关系中非确定性关系的某种确定性。散点图形象地反映了各对数据的密切程度。在求两个变量 x 与 Y之间的回归方程之前先进行相关性检验,当两变量存在线性相关关系时,求出回归直线方程,便可对变量进行预测,由于回归直线将部分观测值所反映的规律进行延伸,所以它在情况预报、资料补充方面有着广泛的应用。3.由于本章在高考中考查难度不大,所以复习时重点体会统计的思想,独立性检验思想以及在实际问题中的应用。背景命题应用性试考景命题应用性试查基础知识和本方法的题同时本运所本景命题应用性试考学及初步本础知识和会判题断线回考用性试本归试模型拟合效果理解独立检验相关系则称理分析识和解为程其本中?
限制150内