第23练 统计与成对数据的统计分析.docx
《第23练 统计与成对数据的统计分析.docx》由会员分享,可在线阅读,更多相关《第23练 统计与成对数据的统计分析.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第23练 统计与成对数据的统计分析专项典题精练1高考汇编. (2017全国HI)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014年1 月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.2014 年2015 年2016 年根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对 7月至12月,波动性更小,变化比较平稳答案A解析 由折线图,7月份后月接待游客量减少,A错误.1 .(多选)(2021 新高考全国I)有一组样本数据为,必,修,由这
2、组数据得到新样本数据V,2,,为,其中y=Xj+c(i=l,2,叫c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD 解析 设样本数据为,尤2,,儿的平均数、中位数、标准差、极差分别为x , m, K依题意得,新样本数据?,”,为的平均数、中位数、标准差、极差分别为九+c,根+。, o, t,因为cWO,所以C, D正确.3.(多选)(2021 .新高考全国H)下列统计量中,能度量样本为,必 ,儿的离散程度的是() A.样本X1,X2,X的标准差B.样本为,X2,%的中位数C.样本乃,孙,x
3、的极差对此新闻事件的关注程度,从该校高三学生中随机抽取了 100名学生进行调查,调查样本中 有40名女生.下图是根据样本的调查结果绘制的等高堆积条形图(阴影区域表示关注“嫦娥 五号”的部分).频率l.(M)0.70().5()女生男生性别完成下面的2义2列联表,并依据小概率值。=0.05的独立性检验,能否认为对“嫦娥五号” 的关注程度与性别有关?关注男女合计没关注合计若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦 娥五号”新闻关注的人数为随机变量X,求X的分布列及均值.附:(a+b)(c+d)(a+c)(b+d)其中a0.1500.1000.0500.0100
4、.005Xa2.0722.7063.8416.6357.879关注没关注合计男303060女122840合计4258100零假设为儿:对“嫦娥五号”的关注程度与性别无关.根据列联表中数据,得100X(30X2812X30)2 80042X58X40X60203心 3.9413.841=祀.05,依据小概率值。=0.05的独立性检验,推断为不成立,即认为对“嫦娥五号”的关注程度与性别有关.因为随机选一名高三女生,对此事关注的概率P=12 340 10又因为X3(3,高,所以随机变量X的分布列为X0123P3431 0004411 0001891 000271 000E(X) np=Q.练后疑难精
5、讲考情分析高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的 形式出现,题目阅读量大,难度中档.一、用样本估计总体【核心提炼】1 .统计中的四个数据特征:众数:在样本数据中,出现次数最多的那个数据.中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个 数为偶数,就取中间两个数据的平均数作为中位数.平均数:样本数据的算术平均数,即7=3为+&+/).(4)方差与标准差:1 2=(1- X )2 + (X2 X )2-1F(x- X )2,S=q、K%l % )2 + (X2 x )2-1X )2.2 .频率分布直方图的两个结论:频率小长方形的面积=组距
6、义启=频率.各小长方形的面积之和等于1.【练后反馈】错题整理:题号1234561012正误二、回归分析【核心提炼】A AA.经验回归直线y=Zzx+经过样本点的中心(三,7),若x取某一个值,代入经验回归方程A AAy=bx+a中,可求出y的估计值.1 .样本相关系数:当0时,称成对样本数据正相关;当K0时,称成对样本数据负相关.当闭0.75时,称成对样本数据具有较强的线性相关关系.【练后反馈】题号8111415正误错题整理:三、独立性检验【核心提炼】1.独立性检验的一般步骤根据样本数据列成2X2列联表;根据公式下4M2172;小不计算/的值;a+/?)(c+a)(a+c)(b+a)A查表比较
7、Z2与临界值的大小关系,作统计判断.2. /的值越大,对应假设事件为成立(两类变量相互独立)的概率越小,%不成立的概率越大.【练后反馈】题号791316正误错题整理:易错对点精补l.Tl补偿(多选)(2021 福州一中模拟)刘女士的网店经营坚果类食品,2020年各月份的收入、 支出(单位:百元)情况的统计如图所示,下列说法中正确的是()A. 4至5月份的收入的变化率与11至12月份的收入的变化率相同B.支出最高值与支出最低值的比是5 : 1C.第三季度月平均收入为5 000元D.利润最高的月份是3月份和10月份答案ACD 解析 对于A选项,4至5月份的收入的变化率为*=20,11至12月份的收
8、入的变化 率为普?=-20,因而两个变化率相同,所以A项正确.对于B选项,支出最高值是2月份的60百元,支出最低值是5月份的10百元,故支出最高 值与支出最低值的比是6: 1,故B项错误.对于C选项,第三季度的7,8,9月每个月的收入分别为40百元,50百元,60百元,故第三季度的平均收入为40+今+6。= 50(百元)故C选项正确.对于D选项,利润最高的月份是3月份和10月份都是30百元,故D项正确.2.T9补偿(2021.蚌埠模拟)某校随机调查了 110名不同的高中生是否喜欢篮球,得到如下的 列联表:力女喜欢篮球4020不喜欢篮球2030附:附:n(ad- be?(a+A)(c+c)(b+
9、J),a0.0500.0100.0013.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别无关”C依据小概率值。=0.01的独立性检验认为“喜欢篮球与性别有关”D.依据小概率值。= 0.01的独立性检验认为“喜欢篮球与性别无关” 答案c立 I 皿=小 o 110X(40X30-20X20)2解析 由题意得 /=-6ox5OX6OX5O7.8226.635=x(),oio,6. 6357.822=租我心0, k0),y=cx2+dx+e三个函数中选择一个作为
10、年广告费用x和年利润额y的回归类型,判断哪个类型符合,不必说明理由;根据中选择的回归类型,求出y与x的经验回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元)参考数据:3.67 8 8,3.678 83 49.787. en _Z (L t )8 - y )A AA i参考公式:经验回归方程丁 =。+初中斜率和截距的最小二乘估计公式分别为人=n 一 Z Qi- t )2 /=1解(1)由散点图知,年广告费用x和年利润额y的回归类型并不是直线型的,而是曲线型的, 且y与1呈正相关.所以选择回归类型更好.(2)对y=m两边取自然对数,得 In y=ln m+M
11、n x9因为 o=lny, w=ln x,贝1o=ln/n+Z4, 由表中数据得,io 30.510X1.5XL5 1Z =46.5-10X1.5X1.5 = 3, 房一10 u 2/=!” 1所以 In m= v k u =1.5 2X 1.5=1,所以m=e, 所以年广告费用x和年利润额y的经验回归方程为y=ex.(3)由,知y=e令 y= e户 10,得户 3.678 8,所以 x3.67883q49,787,所以x49.8(十万元).故下一年应至少投入498万元广告费用.D.样本为,X2,X的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位
12、数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数 的定义可知,平均数考查的是数据的集中趋势.4. (2021 全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户 家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 答案C 解析对于A,根据频率分布直方图可知
13、,家庭年收入低于4.5万元的农户比率约为。02+ 0.04)XlX100% = 6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于 10.5万元的农户比率约为(0.04 + 0.02+0.02+0.02)XlX100%=10%,故B正确;对于C,根 据频率分布直方图可知,该地农户家庭年收入的平均值约为3X0.02 + 4X0.04 + 5X0.10 + 6X0.14 + 7X0.20 + 8X0.20 + 9X0.10+10X0.10+11 X0.04+12X0.02+13X0.02+14X0.02 = 7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4
14、.5万元至 8.5万元之间的农户比率约为(0.10+0.14+率20+0.20)X1 X100%=64%50%,故D正确.5. (2019全国H)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10 个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经 停该站高铁列车所有车次的平均正点率的估计值为.10X0.97 + 20X0.98+10X0.9910+20+10答案0.98 解析 经停该站高铁列车所有车次的平均正点率的估计值为= 0.98.6. (2014.江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 23 统计 成对 数据 统计分析
限制150内