专题五,,,第1讲,统计与统计案例(解析版).docx
《专题五,,,第1讲,统计与统计案例(解析版).docx》由会员分享,可在线阅读,更多相关《专题五,,,第1讲,统计与统计案例(解析版).docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、专题五,第1讲,统计与统计案例(解析版)第 第 1 1 讲统计与统计案考点一 统计图表 1频率分布直方图中横坐标表示组距,纵坐标表示 频率组距 ,频率组距×频率组距 . 2频率分布直方图中各小长方形的面积之和为 1. 3利用频率分布直方图求众数、中位数与平均数 频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数 (2)中位数左边和右边的小长方形的面积和相等 (3)平均数是频率分布直方图的重心,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和1 (1)(多选)(2020新高考全国)我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产,下面是某地连续 1
2、1 天复工复产指数折线图,下列说法正确的是()A这 11 天复工指数和复产指数均逐日增加 B这 11 天期间,复产指数增量大于复工指数的增量 C第 3 天至第 11 天复工复产指数均增大都超过 80% D第 9 天至第 11 天复产指数增量大于复工指数的增量CD (2)学校为了了解新课程标准提升阅读要求对学生阅读爱好的影响状况,随机抽取了 100 名学生进行调查依据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于 30 分钟的学生称为阅读霸,则下列结论正确的是() A抽样表明,该校约有一半学生为阅读霸 B该校只有 50 名学生不喜爱阅读 C该校只有 50 名学生喜爱阅读
3、D抽样表明,该校有 50 名学生为阅读霸A依据频率分布直方图可列下表:阅读时间(分钟) 0,10) 10,20) 20,30) 30,40) 40,50) 50,60 抽样人数(名) 10 18 22 25 20 5抽样 100 名学生中有 50 名为阅读霸,占一半,据此可推断该校约有一半学生为阅读霸 易错提示 (1)对于给出的统计图表,肯定要结合问题背景理解图表意义,不能似懂非懂 (2)频率分布直方图中纵坐标不要误以为频率 1 (1)某旅游城市为向游客介绍本地的气温状况,绘制了一年中各月平均最高气温柔平均最低气温的雷达图图中 A 点表示十月的平均最高气温约为 15 ,B 点表示四月 的平均最
4、低气温约为 5 .下面叙述不正确的是()A各月的平均最低气温都在 0 以上 B七月的平均温差比一月的平均温差大 C三月和十一月的平均最高气温基本相同 D平均最高气温不低于 20 的月份有 5 个D由题中雷达图易知 A,C 正确七月份平均最高气温超过 20 ,平均最低气温约为 13 ;一月份平均最高气温约为 6 ,平均最低气温约为 2 ,所以七月的平均温差比一月平均温差大,故 B 正确由题图知平均最高气温不低于 20 的月份为六、七、八月,有 3 个 (2)(多选)(2020重庆模拟)新高考方案规定,一般中学学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其中选择考成果将计入高考总成
5、果,即将学生考试时的原始卷面分数由高到低进行排序,评定为 A,B,C,D,E 五个等级,再转换为分数计入高考总成果某试点中学 2020 年参与选择考总人数是 2018 年参与选择考总人数的 2 倍,为了更好地分析该校学生选择考的水平状况,统计了该校 2018 年和 2020 年选择考成果等级结果,得到如图所示的统计图针对该校选择考状况,2020 年与 2018 年比较,下列说法正确的是() A获得 A 等级的人数增加了 B获得 B 等级的人数增加了 1.5 倍 C获得 D 等级的人数削减了一半 D获得 E 等级的人数相同AB设 2018 年参与选择考的总人数为 x,则 2020 年参与选择考的
6、总人数为2x,依据图表得出 2018 年和 2020 年各个等级的人数如表所示等级 年份 A B C D E 2018 0.28x 0.32x 0.30x 0.08x 0.02x 2020 0.48x 0.8x 0.56x 0.12x 0.04x由表可知,获得 A 等级的人数增加了,故 A 正确;获得 B 等级的人数增加了 0.8x0.32x0.32x1.5倍,故 B 正确;获得 D 等级的人数增加了,故 C 错误;获得 E 等级的人数不相同,故 D 错误考点二 回来分析 在分析两个变量的相关关系时,可依据样本数据作出散点图来推断两个变量之间是否具有相关关系若具有线性相关关系,则回来直线过样本
7、点的中心( x , y ),并且可通过线性回来方程估计预报变量的值2 (2020全国)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块中用简洁随机抽样的方法抽取 20 个作为样区,调查得到样本数据(x i ,y i )(i1,2,20),其中 x i 和 y i 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 i 60, i 1 200,(x i x )2 80, (y i y )2 9 000,(xi x )(y i y )800. (1)求该地区这种野生动物数量的估
8、计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数); (2)求样本(x i ,y i )(i1,2,20)的相关系数(精确到 0.01); (3)依据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更精确的估计,请给出一种你认为更合理的抽样方法,并说明理由 解 (1)由已知得样本平均数 y 120i 60, 从而该地区这种野生动物数量的估计值为 60×20012 000. (2)样本(x i ,y i )(i1,2,20)的相关系数r80080×9 000 2 23≈0.94. (3)分层抽样:
9、依据植物覆盖面积的大小对地块分层,再对 200 个地块进行分层抽样 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系由于各 地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采纳分层抽样的方法较好地保持了样本结构与总体结构的一样性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更精确的估计 规律方法 样本数据的相关系数 r∑ni1x i x y i y∑ni1x i x2∑ni1y i y2 , 反映样本数据的相关程度,|r|越大,则相关性越强 2 (1)已知某产品的销售额 y 与广告费用 x 之间的关系如下表:x(
10、单位:万元) 0 1 2 3 4 y(单位:万元) 10 15 20 30 35若求得其线性回来方程为y6.5xa,则预料当广告费用为 6 万元时的销售额为() A42 万元B45 万元C48 万元D51 万元C由题意,依据上表中的数据, 可得 x 2, y 22, 即样本点的中心为(2,22), 又线性回来方程y6.5xa经过样本点的中心, 所以 226.5×2a,解得a9, 所以y6.5x9,当 x6 时,y48. (2)(2020河北衡水中学月考)有一散点图如图所示,在 5 个(x,y)数据中去掉 D(3,10)后,下列说法正确的是()A残差平方和变小 B相关系数 r 变小
11、C相关指数 R2 变小 D说明变量 x 与预报变量 y 的相关性变弱A从散点图可分析得出:只有 D 点偏离直线远,去掉 D 点,说明变量 x 与预报变量 y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差平方和变小,故选 A.考点三 独立性检验 假设有两个分类变量 X 和 Y,它们的取值分别为x 1 ,x 2 和y 1 ,y 2 ,其样本频数列联表(称为2×2 列联表)为:y 1y 2总计 x 1a b ab x 2c d cd 总计 ac bd abcdK2 n adbc2ab ac bd cd(其中 nabcd 为样本容量) 3 (2020新高考全国)为加
12、强环境爱护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100 天空气中的 PM2.5 和 SO 2 浓度(单位:μg/m3 ),得下表:SO 2 PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10(1)估计事务该市一天空气中 PM2.5 浓度不超过 75,且 SO 2 浓度不超过 150的概率; (2)依据所给数据,完成下面的 2×2 列联表:SO 2 PM2.5 0,150 (150,475 0,75 (75,115(3)依据(2)中的列联表,推断是否有 99%的把握
13、认为该市一天空气中 PM2.5 浓度与 SO 2 浓度有关? 附:K2 n adbc2ab cd ac bd, P(K2 ≥k0 ) 0.050 0.010 0.001 k 03.841 6.635 10.828解 (1)由表格可知,该市 100 天中,空气中的 PM2.5 浓度不超过 75,且 SO 2 浓度不 超过 150 的天数为 32618864, 所以该市一天中,空气中的PM2.5浓度不超过75,且SO 2 浓度不超过150的概率的估计值为641000.64. (2)由所给数据,可得 2×2 列联表:SO 2 PM2.5 0,150 (150,475 0,75 64
14、 16 (75,115 10 10(3)依据 2×2 列联表中的数据可得 K2 n adbc2ab cd ac bd 10064×1016×10280×20×74×26 ≈7.484>6.635, 故有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO 2 浓度有关 规律方法 独立性检验的关键 (1)依据 2×2 列联表精确计算 K2 ,若 2×2 列联表没有列出来,要先列出此表 (2)K2 的观测值 k 越大,对应的假设 H0 成立的概率越小,H 0 不成立的概率越大 3
15、 (1)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简洁随机抽样方法从不同地区调查了 100 位育龄妇女,结果如下表 非一线城市 一线城市 总计 愿生 45 20 65 不愿生 13 22 35 总计 58 42 100附表:P(K2 ≥k0 ) 0.100 0.050 0.010 0.001 k 02.706 3.841 6.635 10.828由 K2 n adbc2ab cd ac bd计算得, K2 的观测值 k 10045×2220×13258×42×35×65≈9.61
16、6, 参照附表,得到的正确结论是() A在犯错误的概率不超过 0.1%的前提下,认为生育意愿与城市级别有关 B在犯错误的概率不超过 0.1%的前提下,认为生育意愿与城市级别无关 C有 99%以上的把握认为生育意愿与城市级别有关 D有 99%以上的把握认为生育意愿与城市级别无关C由题意知, K2 的观测值 k≈9.616>6.635, ∴有 99%以上的把握认为生育意愿与城市级别有关 (2)某校团委对学生性别和喜爱某视频 APP 是否有关做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜爱某视频 APP 的人数占男生人数的 16 ,女生喜爱某视频 APP
17、的人数占女生人数的 23 ,若有 95%的把握认为喜爱某视频 APP 和性别有关,则男生至少有() 附:P(K2 ≥k0 ) 0.050 0.010 k 03.841 6.635K2 n adbc2ab cd ac bd. A12 人B6 人C10 人D18 人A设被调查的男生人数为 x,则被调查的女生人数为 x2 ,则 2×2 列联表为喜爱某视频 APP 不喜爱某视频 APP 总计 男生 x65x6 x 女生 x3x6x2总计 x2x 3x2若有 95%的把握认为喜爱某视频 APP 和性别有关,则 K2 ≥3.841,即 K 2 3x2 x6 ×x6 5x
18、6× x32x× x2 ×x2 ×x 3x8≥3.841,则 x≥ 3.841×83≈10.243,又 x2 ,x3 ,x6 均为整数,所以男生至少有 12 人 专题 训练一、单项选择题 1某人 5 次上班途中所花的时间(单位:分钟)分别为 x,y,10,11,9,已知这组数据的平均数为 10,方差为 2,则|xy|的值为() A4B3C2D1A依题意有 xy10119510,(x10)2 (y10) 2 (1010) 2 (1110) 2 (910)2 5×2,解得 x8,y12 或 x12,y8
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题 统计 案例 解析
限制150内