2022年高中数学必修复习-统计的讲义与习题.docx
精选学习资料 - - - - - - - - - 【学问点:统计】一简洁随机抽样1总体和样本总体:在统计学中 , 把讨论对象的全体叫做总体个体:把每个讨论对象叫做个体总体容量:把总体中个体的总数叫做总体容量为了讨论总体的有关性质,一般从总体中随机抽取一部分:,讨论,我们称它为样本其中个体的个数称为样本容量 ;2简洁随机抽样,也叫纯随机抽样;就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位;特点 是:每个样本单位被抽中的可能性相同概率相等 ,样本的每个单位完全独立, 彼此间无肯定的关联性和排斥性;简洁随机抽样是其它各种抽样形式的基础;通常只是在总体单位之间差异程度较小和数目较少时,才采纳这种方法;3简洁随机抽样常用的方法: 1抽签法;随机数表法;电脑模拟法;使用统计软件直接抽取;在简洁随机抽样的样本容量设计中,概率保证程度;4抽签法 : 主要考虑: 总体变异情形; 答应误差范畴; 1给调查对象群体中的每一个对象编号; 2预备抽签的工具,实施抽签 3对样本中的每一个个体进行测量或调查 例:请调查你所在的学校的同学做喜爱的体育活动情形;5随机数表法:例:利用随机数表在所在的班级中抽取 二系统抽样10 位同学参与某项活动;1系统抽样等距抽样或机械抽样:把总体的单位进行排序,再运算出抽样距离,然后依据这一固定的抽样距离抽取样本;第一个样本采纳简洁随机抽样的方法抽取;d抽样距离 =N总体规模 /n 样本规模三.分层抽样1分层抽样类型抽样 :先将总体中的全部单位依据某种特点或标志性别、年龄等划分成假设干类型或层名师归纳总结 - - - - - - -第 1 页,共 13 页精选学习资料 - - - - - - - - - 次,然后再在各个类型或层次中采纳简洁随机抽样或系用抽样的方法抽取一个子样本,最终,将这些子样本合起来构成总体的样本;2分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体 中的样本分别代表该子总体,全部的样本进而代表总体;3分层的比例问题: 1按比例分层抽样:依据各种类型或层次中的单位数目占总体单位数目的比重来抽取 子样本的方法;四样本频率分布图 1. 作图步骤: 1 求极差一组数据中最大值和最小值得差2打算组距和组数;3将数据分组;4运算各小组的频率,列频率分布表;5画频率分布直方图2. 特点:1以面积的形式反映数据落在各小组的频率大小;2 小长方形的面积组距频率频率组距(3)各小长方形的面积的总和等于1.五茎叶图适用范畴: 在样本数据较少时,用茎叶图表示数据的成效较好,它不但可以保留全部信息,而且可以随时记录;当样本数据较多时,茎叶图就不太便利了;六用样本的数字特点估量总体的数字特点1、本均值:xx1x2nxnx2x 2x 2xnx22、样本标准差:s2 sx 1n3用样本估量总体时,假如抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差;在随机抽样中,这种偏差是不行防止的;虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估量,但这种估量是合理的,特殊是当样本量很大时,它们的确反映了总体的信息;41假如把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 2假如把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原先的k 倍五两个变量的线性相关名师归纳总结 - - - - - - -第 2 页,共 13 页精选学习资料 - - - - - - - - - 1、概念 : 1回来直线方程y.b xa 2回来系数binxix yi2yinx iyinxyaybx1inx ix1x2nx2n1ii12最小二乘法3直线回来方程的应用1描述两变量之间的依存关系;利用直线回来方程即可定量描述两个变量间依存 的数量关系2利用回来方程进行猜测;把预报因子 即自变量 x代入回来方程对预报量即 因变量 Y进行估量,即可得到个体 Y值的容许区间;3利用回来方程进行统计掌握规定 Y 值的变化,通过掌握 x 的范畴来实现统计控 制的目标;4回来直线肯定经过样本的中心点【例题讲解】 x , y ,据此性质可以解决有关的运算问题1. 某同学使用运算器求 30个数据的平均数时,错将其中一个数据 105输入为 15,那么由此求出的平均数与实际平均数的差是 A 3.5 B 3C 3 D 0 . 52. 设有一个直线回来方程为 y 2 1.5 x ,就变量 x 增加一个单位时A y 平均增加 1.5个单位 B y 平均增加 2 个单位C y平均削减1.5个单位 D y平均削减2个单位3. 从 N 个编号中抽取 n 个号码入样,假设采纳系统抽样方法进行抽取,就分段间隔应为 A N B n C N D N 1n n n4.从某厂生产的 802 辆轿车中抽取 80 辆测试某项性能请合理挑选抽样方法进行抽样,并写出抽样过程名师归纳总结 - - - - - - -第 3 页,共 13 页精选学习资料 - - - - - - - - - 5.为了明白参与运动会的2000名运发动的年龄情形,从中抽取100名运发动;就这个问题,以下说法中正确的有; 2000名运发动是总体;每个运发动是个体;所抽取的样本容量为 100;这个抽样方法可采纳按年龄进行分层抽样;率相等6.数据 70,71,72,73 的标准差是 _,就7.数据a a2,a 3,.,a 的方差为2,平均数为100名运发动是一个样本;每个运发动被抽到的概1数据ka 1b ka 2b ka3b ,.,kanb,kb0的标准差为,平均数为(2)数据k a 1b,k a2b,k a3b,.,k a nb,kb0的标准差为,平均数为8.用样本频率分布估量总体频率分布的过程中,以下说法正确的选项是72 52 68 9A总体容量越大,估量越精确 B总体容量越小,估量越精确C样本容量越大,估量越精确 D样本容量越小,估量越精确从两个班中各随机的抽取10名同学,他们的数学成果如下:甲班76 74 82 96 66 76 78 乙班86 84 62 76 78 92 82 74 88 85 画出茎叶图并分析两个班同学的数学学习情形【课堂练习】1. 相关关系与函数关系的区分是2. 从10个篮球中任取一个,检验其质量,就应采纳的抽样方法为3. 以下说法错误的选项是 A 在统计里,把所需考察对象的全体叫作总体B 一组数据的平均数肯定大于这组数据中的每个数据_名师归纳总结 C平均数、众数与中位数从不同的角度描述了一组数据的集中趋势第 4 页,共 13 页- - - - - - -精选学习资料 - - - - - - - - - D 一组数据的方差越大,说明这组数据的波动越大4. 要明白全市高一同学身高在某一范畴的同学所占比例的大小,需知道相应样本的 A 平均数 B 方差C 众数 D 频率分布5. 要从已编号 1 60的 60 枚最新研制的某型导弹中随机抽取 6 枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的 6 枚导弹的编号可能是A 5,10,15,20,25,30 B 3,13,23,33,43,53C 1,2,3, 4,5,6 D 2,4,8,16,32,486. 数据 a a 2 , a 3 ,., a 的方差为 2 ,就数据 2 a 1 ,2 a 2 ,2 a 3 ,., 2 a 的方差为22 2 2A B C 2 D 427. 已知样本 9,10,11, , x y 的平均数是 10,标准差是 2 ,就 xy8. 有 50件产品编号从 1到 50 , 现在从中抽取 5 件检验 , 用系统抽样确定所抽取的编号为 A 5,10,15,20,25 B 5,15,20,35,40C 5,11,17,23,29 D 10,20,30,40,5092022 ·武夷模拟 用系统抽样法要从 160 名同学中抽取容量为 20 的样本, 将 160 名同学随机地从 1160 编号,按编号次序平均分成20 组18 号, 916 号, , 153 160 号,假设第 16 组抽出的号码为 126,就第 1 组中用抽签的方法确定的号码是 _102022 ·江西 样本 x1,x2, , xn的平均数为 x ,样本 y1,y2, , ym的平均数为 y xy 假设样本 x1,x2, , xn,y1,y2, , ym的平均数 z x 1 y ,其中0<< 12,就 n,m 的大小关系为 A n<m Bn>m C nm D不能确定11已知施化肥量 x 与水稻产量 y 的试验数据如下表,就变量 x 与变量 y 是_相关 填“ 正” 或“ 负”. 施化肥量 x 15 20 25 30 35 40 45 水稻产量 y 330 345 365 405 445 450 455 12 2022 ·长春调研 已知 x,y 取值如下表:名师归纳总结 - - - - - - -第 5 页,共 13 页精选学习资料 - - - - - - - - - x 014568 y 从所得的散点图分析可知:y 与 x 线性相关,且 yxa,就 a A 1.30 B1.45 C 1.65 13.某班同学利用国庆节进行社会实践,对 25,55 岁的人群随机抽取 n 人进行了一次生活习惯是否符合低碳观念的调查,假设生活习惯符合低碳观念,称为“ 低碳族” , 否就称为“ 非低碳族” ,得到如下统计表和各年组数 分组 低碳族的人数 占本组的频率 龄段人数频率分布直方图:第一组 25,30 120其次组 30,35 195 p第三组 35,40 100第四组 40,45 a 第五组 45,50 30第六组 50,55 151补全频率分布直方图;2求 n,a,p 的值14 以下是某地搜集到的新居屋的销售价格 y 和房屋的面积 x 的数据:1画出数据对应的散点图;2求线性回来方程,并在散点图中加上回来直线;3据 2的结果估量当房屋面积为2 150m 时的销售价格100 分的茎叶图和频率分152022 ·揭阳调研 某校高一某班的某次数学测试成果总分值为布直方图都受了不同程度的破坏,但可见部分如图,据此解答以下问题:名师归纳总结 - - - - - - -第 6 页,共 13 页精选学习资料 - - - - - - - - - 1求分数在 50,60 的频率及全班人数;2求分数在 80,90 之间的频数,并运算频率分布直方图中16已知某单位有50 名职工,现要从中抽取10 名职工,将全体职工随机按 150 编号,并按编号次序80,90间的矩形的高平均分成 10 组,按各组内抽取的编号依次增加 5 进行系统抽样1 假设第 5 组抽出的号码为 22,写出全部被抽出职工的号码;2分别统计这 10 名职工的体重 单位:公斤 ,获得体重数据的茎叶图如下图,求该样本的方差;3在2 的条件下,从这 10 名职工中随机抽取两名体重不轻于 73 公斤 73 公斤 的职工,求体重为 76 公斤的职工被抽取到的概率【课后作业】名师归纳总结 1.一个容量为 20的样本,已知某组的频率为0.25,就该组的频数为_第 7 页,共 13 页2.用随机数表法从 100名同学男生 25 人中抽取 20人进行评教,某男生被抽取的机率是_32022 ·沈阳质检 沈阳市某高中有高一同学600 人,高二同学500 人,高三同学550 人,现对同学关于消防安全学问明白情形进行分层抽样调查,假设抽取了一个容量为n 的样本,其中高三同学有11 人,就 n 的值等于 _- - - - - - -精选学习资料 - - - - - - - - - 4. 一个容量为 20 的样本数据,分组后组距与频数如下表:组10,2020, 3030, 4040 ,5050,6060, 70距频 2 3 4 5 4 2 数就样本在区间 ,50 上的频率为 _5. 某单位有老年人 28人,中年人 54人,青年人 81人,为调查身体健康状况,需要从中抽取一个容量为 36 的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取_人、人、人6. 某学校共有老师 490人,其中不到 40岁的有 350人, 40 岁及以上的有 140人 为了了解一般话在该校中的推广普及情形,用分层抽样的方法, 从全体老师中抽取一个容量为 70 人的样本进行一般话水平测试,其中在不到40岁的老师中应抽取的人数为多少人?7.如图,从参与环保学问竞赛的同学中抽出60 名,将其成果均为整数整理后画出的频率分布直方图如下:观看图形,答复以下问题:1 79.5 89.5这一组的频数、频率分别是多少?名师归纳总结 2估量这次环保学问竞赛的及格率60分及以上为及格第 8 页,共 13 页- - - - - - -精选学习资料 - - - - - - - - - 统计答案【例题答案】例 1. B 少输入 90, 903, 平均数少 3 ,求出的平均数减去实际的平均数等于 330例 2. 0.7 14 0.7 例 3. C 剔除零头204. 审题视点 由于 802 不能整除 80,为了保证 “等距 ” 分段,应先剔除 2 个个体解 由于总体及样本中的个体数较多,且无明显差异,因此采纳系统抽样的方法,步骤如下:第一步:先从 802 辆轿车中剔除 2 辆轿车 剔除方法可用随机数法 ;其次步: 将余下的 800 辆轿车编号为 1,2, ,800,并匀称分成 80 段,每段含 k800 8010 个个体;第三步:从第 1 段即 1,2, , 10 这 10 个编号中,用简洁随机抽样的方法抽取一个编号如 5作为起始编号;第四步:从5 开头,再将编号为15,25, , 795 的个体抽出,得到一个容量为80 的样本解决系统抽样问题的两个关键步骤为:1分段的方法应依据抽取的样本容量而定,即依据定义每段抽取一个样本2起始编号的确定应用简洁随机抽样的方法,一旦起始编号确定,其他编号便随之确定名师归纳总结 5.,2000名运发动的年龄情形是总体;每个运发动的年龄是个体;k52 nb第 9 页,共 13 页6. 5X70714727371.5,2s17071.527171.527271.52732 71.5 4271 k, kb 2 k, kkbbka 1bka2b.kanbka 1a 2n.anbk1Xns1 nka 1bkb2ka 2bkb2.kanbbk1 na 12a 22.a n2 knbk2Xk a 1bk a 2b.k anbka 1a 2n.ann- - - - - - -精选学习资料 - - - - - - - - - s1 nka 1kbkkb 2ka 2kbkkb 2.ka nkbk2 kb 8. k1 na 12 2a22.an2 kC 9. 解:5 乙班甲班286 6 2 6 6 4 7 4 6 8 28 2 4 5 6 8 6 9 2 乙班级总体成果优于甲班【课堂练习】1.函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有肯定的随机性2. 简洁随机抽样 3. B 平均数不大于最大值,不小于最小值4 D 5 B 60 10,间隔应为 106n n n2 1 2 1 2 1 2 26. D X i X , 2 X i 2 X 4 X i X 4 ,n i 1 n i 1 n i 12 27.96 9 10 11 x y 50, x y 20,1 1 x 10 y 10 10,2 2 2x y 20 x y 192, x y 2 xy 20 x y 192, xy 968.D 间隔为 109. 6 解析 设第 1 组抽取的号码为 b,就第 n 组抽取的号码为 8n1b,8× 161b126,b 6,故第 1 组抽取的号码为 6.10. 解析 依题意得 x1x2 xnn x ,y1y2 ymm y ,x1x2 xny1y2 ymmn z mn x m n1 y ,n x m y mn x mn1 y ,名师归纳总结 n m n ,于是有 n m mn 1 mn2 1,第 10 页,共 13 页m mn 1 ,0<<1 2,21<0,n m<0,即 m>n. 答案A- - - - - - -精选学习资料 - - - - - - - - - 11 .正12. 解析 依题意得,x 1 6× 0145 684, y 1 6× yxa 必过样本中心点 x ,y × 4 a,由此解得 a1.45,选 B. 13.审题视点 1 要补全频率分布直方图,关键是运算出其次组的频率;2敏捷运用关系式:频率 频数× 组距频率,频率求解组距 样本容量解 1其次组的频率为 10.040.040.03 0.020.01× 50.3,所以小长方形的高为 0.06.频率分布直方图如下图2第一组的人数为 120 0.6× 50.2, 所以 n200 0.21 000. 由1知,其次组的频率为0.3,所以其次组的人数为1 000× 0.3300,所以 p195 300× 50.15,所以第四组的人数为1 000× 0.15150,所以 a150× 0.460. 1绘制频率分布直方图时需留意:制作好频率分布表后可以利用各组的频 频率 率之和是否为 1 来检验该表是否正确;频率分布直方图的纵坐标是,而不是频率组距频率 2由频率分布直方图进行相关运算时,需把握以下关系式:× 组距频率组距 14. 解:1数据对应的散点图如下图:名师归纳总结 2x1i5ix109,lxx521570,第 11 页,共 13 页xix51yii15y308y232.,lxyxix i1bxa,设所求回来直线方程为y- - - - - - -精选学习资料 - - - - - - - - - 就blxy308.0 1962lxx1570a y b x 23 2. 109 308 .1 8166 ,故所求回来直线方程为 y 0 . 1962 x 1 . 816615703据 2,当 x 150 m 时,销售价格的估量值为:2y 0 . 1962 150 1 . 8166 31 . 2466万元15. 解× 100.08. 由茎叶图知,分数在 50,60 之间的频数为 2,所以全班人数为 0.0825. 22分数在 80,90 之间的频数为 25 271024,频率分布直方图中 80,90间的矩形的高为4 25÷100.016.16.解 1由题意,第 5 组抽出的号码为 22. 由于 k5× 5122,所以第 1 组抽出的号码应当为 2,抽出的 10 名职工的号码分别为 2,7,12,17,22,27,32,37,42,47. 2由于 10 名职工的平均体重为x 1 10817073767879 626567 5971,所以样本方差为:s21 1010212225272 8292624212252. 3从 10 名职工中随机抽取两名体重不轻于 73 公斤的职工,共有 10 种不同的取法:73,76 ,73,78,73,79,73,81,76,78 ,76,79,76,81,78,79 ,78,81 ,79,81名师归纳总结 记“ 体重为76 公斤的职工被抽取” 为大事A,它包括的大事有73,76,76,78,76,79,第 12 页,共 13 页76,81 共 4 个故所求概率为PA102 5. 【课后作业】 1. 5频率=频数21每个个体被抽取的机率都是201样本容量510053. 解析由n11 550,得 n 33人6005005504. 0.7140.720561218总人数为285481163 28366 543612 813618,1631631636. 解:而抽取的比例为701 , 7,在不到 40 岁的老师中应抽取的人数为35015049077.解:1频率为: 0.025 10 0.25,频数: 60 0.25 152 0.015 10 0.025 10 0.03 10 0.005 10 0.75- - - - - - -精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 13 页