统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册.docx
-
资源ID:98011329
资源大小:446.26KB
全文页数:12页
- 资源格式: DOCX
下载积分:3金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册.docx
统计知识点(一)-师知识点一简单随机抽样(1)定义放回简单随机抽样不放回简单随机抽样概念一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,这样的抽样方法叫做不放回简单随机抽样(2)常用方法实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法知识点二总体平均数与样本平均数1总体平均数(1)一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,YN,则称Yi为总体均值,又称总体平均数(2)如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1,Y2,Yk,其中Yi出现的频数fi(i1,2,k),则总体均值还可以写成加权平均数的形式fiYi2样本平均数如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,yn,则称yi为样本均值,又称样本平均数在简单随机抽样中,我们常用样本平均数去估计总体平均数.例题1.某班有50名学生,要从中随机地抽出6人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程【解】(1)利用抽签法步骤如下:第一步:将这50名学生编号,编号为01,02,03,50;第二步:将50个号码分别写在外观、质地均无差别的小纸片上,并揉成团,制成号签;第三步:将得到的号签放在一个不透明的容器中,搅拌均匀;第四步:从容器中逐一抽取6个号签,并记录上面的号码对应上面6个号码的学生就是参加该项活动的学生(2)利用随机数法步骤如下:第一步:将这50名学生编号,编号为01,02,03,50;第二步:用随机数工具产生150范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本;第三步:重复第二步的过程,直到抽足样本所需人数对应上面6个号码的学生就是参加该项活动的学生练习一1某工厂对40个零件进行抽样调查,将其编号为00,01,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第5个零件编号是()034743738636964736614698637162332616804560111410 A36 B16 C11 D14解:选C从题中给的随机数表第一行第3列开始从左往右开始读取,重复的数字只读一次,读到的小于40的编号分别为36,33,26,16,11.所以选出来的第5个零件编号是11.故选C2从某批零件中抽取50个,然后再从50个零件中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为() A36% B72% C90% D25%解:选C×100%90%.3某学校高一年级(1)班,(2)班,(3)班的人数分别为45,50,55,在某次考试中,(1)班的平均分为83分,(3)班的平均分为91分,三个班的平均分为86.6分,则(2)班的平均分为()A84分 B85分 C86分 D87分解:选B设(2)班的平均分为x分,则有:86.6,解得x85.4有4万个不小于70的两位数,从中随机抽取了3 000个数据,统计如下:数据x70x7980x8990x99个数8001 300900平均数78.18591.9请根据表格中的信息,估计这4万个数据的平均数约为()A92.16 B85.23 C84.73 D77.97解:选B这3 000个数据的平均数为85.23.用样本平均数估计总体平均数,可知这4万个数据的平均数约为85.23. 故选B5为了节约用水,制定阶梯水价,同时又不加重居民生活负担,某市物价部门在8月份调查了本市某小区300户居民中的50户居民,得到如下数据:用水量/m3181920212223242526频数24461210822物价部门制定的阶梯水价实施方案为:月用水量水价/(元/m3)不超过21 m33超过21 m3的部分4.5(1)计算这50户居民的用水的平均数;(2)写出水价的函数关系式,并计算用水量为28 m3时的水费;解:(1)×(18×219×420×421×622×1223×1024×825×226×2)22.12(m3). (2)设月用水量为x m3,则水价为f(x)当x28时,f(28)4.5×2831.594.5(元).知识点三分层随机抽样(1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层(2)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配练习二1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A4 B5 C6 D7解:选C四类食品的种数比为4132,则抽取的植物油类的种数为20×2,抽取的果蔬类的种数为20×4,二者种数之和为6,故选C2某小学三年级有甲、乙两个班,其中甲班有男生30人,女生20人,乙班有男生25人,女生25人,现在需要各班按男、女生分层抽取20%的学生进行某项调查,则两个班共抽取男生人数是() A10 B11 C20 D21解:选B因为甲班有男生30人,女生20人,乙班有男生25人,女生25人,各班按男,女生分层抽取20%的学生进行某项调查,所以甲班需抽取(3020)×20%10(人),其中男生抽取10×6(人),乙班需抽取(2525)×20%10(人),其中男生抽取10×5(人).则两个班共抽取男生人数是6511.故选B3某校高一、高二、高三共有2 800名学生,为了解学生每天学习情况,计划用分层随机抽样的方法抽取一个容量为56的样本,已知从高二学生中抽取的人数为19,则高二学生人数为_解:设该校高二学生人数为x,则,解得x950.4某校为了解学生的学习情况,采用按年级分层随机抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k54,抽取的样本中高一学生有120人,则k的值为_ 解:由题意可得,解得k6.5某网站针对“2023年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:支持A方案支持B方案支持C方案35岁以下的人数20040080035岁以上(含35岁)人数100100400(1)从所有参与调查的人中,用分层随机抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;(2)从支持B方案的人中,用分层随机抽样的方法抽取5人,在这5人中35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?解:(1)由题意得,解得n40.(2)35岁以下的人数为×54,35岁以上(含35岁)的人数为×51.知识点四频率分布直方图的画法(1)画频率分布直方图时,纵坐标表示的是频率与组距的比值,而不是频率(2)频率分布直方图是以面积的形式反映了数据落在各个小组的频率大小,相应组的频率等于该组上的小长方形的面积,即小长方形的面积组距×频率,所以各小长方形的面积的总和等于1,即样本数据落在整个区间的频率为1.从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图【解】(1)频率分布表如下:成绩分组频数频率累积频率40,50)20.040.0450,60)30.060.160,70)100.20.370,80)150.30.680,90)120.240.8490,10080.161.00合计501.00(2)频率分布直方图如图所示知识点五其他统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势练习三1. 某家庭2020年收入的各种用途占比统计如图1所示,2021年收入的各种用途占比统计如图2所示已知2021年的“旅行”费用比2020年增加了3 500元,则该家庭2021年的“衣食住”费用比2020年增加了()A2 000元B2 500元 C3 000元 D3 500元【解】设该家庭2020年的收入为x元,2021年的收入为y元由题意得35%y35%x3 500,即yx10 000,所以2021年的“衣食住”费用比2020年增加了25%y25%x2 500(元).2(多选)某网店2021年全年的月收支数据如图所示,则针对2021年这一年的收支情况,下列说法正确的是()A月收入的极差为60万元B7月份的利润最大C这12个月利润的平均数在30万元以上D这一年的总利润超过400万元解:选ABC由题图可知月收入的极差为903060(万元),故A正确.1至12月份的利润(单位:万元)分别为:20,30,20,10,30,30,60,40,30,30,50,30.其中7月份的利润最大,故B正确易求得总利润为380万元,月平均利润为31.7(万元),故C正确,D错误3如图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校在校学生3 000人,根据统计图计算该校共捐款_元解:由题图,得高一人数为3 000×32%960,捐款数是960×1514 400(元);高二人数为3 000×33%990,捐款数是990×1312 870(元);高三人数为3 000×35%1 050,捐款数是1 050×1010 500(元).所以该校学生共捐款14 40012 87010 50037 770(元).4. 某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100.(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数分数段50,60)60,70)70,80)80,90xy11213445解:(1)依题意得,10×(2a0.020.030.04)1,解得a0.005.(2)数学成绩在50,60)之间的人数为100×0.055,数学成绩在60,70)之间的人数为100×0.4×20,数学成绩在70,80)之间的人数为100×0.3×40,数学成绩在80,90)之间的人数为100×0.2×25,所以数学成绩在50,90)之外的人数为100520402510.5如图所示的是总体的一个样本频率分布直方图,且在15,18)内的频数为8.(1)求样本在15,18)内的频率; (2)求样本量;(3)若在12,15)内的小长方形面积为0.06,求在18,33内的频数解:由题中样本频率分布直方图可知组距为3.(1)样本在15,18)内的频率为×3.(2)因为样本在15,18)内的频数为8,所以样本量为8×50.(3)在12,15)内的小长方形面积为0.06,所以样本在12,15)内的频率为0.06,故样本在15,33内的频数为50×(10.06)47,又在15,18)内的频数为8,所以在18,33内的频数为47839.知识点六百分位数的定义1第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值2计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据第2步,计算in×p%第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数3四分位数第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:79,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量【解】(1)所有数据从小到大排,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%3,12×75%9,12×95%11.4,则第25百分位数是8.15,第75百分位数是8.75,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g练习四1对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:27,38,30,36,35,31,33,29,38,34,28,36.则他的最大速度的第一四分位数是() A27.5 B28.5 C29.5 D30.5解:选C把数据从小到大排序,得27,28,29,30,31,33,34,35,36,36,38,38.第一四分位数即第25百分位数,由12×25%3,可知第一四分位数为第3项与第4项数据的平均数,即×(2930)29.5.2以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是() A90 B90.5 C91 D91.5解:选B把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%12,所以这15人成绩的第80百分位数是90.5.3下图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,求该班的模拟考试成绩的80%分位数(结果保留两位小数)【解】由题图可知,分数在120分以下的学生所占的比例为(0.010.0150.0150.03)×10×100%70%,分数在130分以下的学生所占的比例为(0.010.0150.0150.030.022 5)×10×100%92.5%,因此,80%分位数一定位于120,130)内 由120×10124.44.故该班的模拟考试成绩的80%分位数约为124.44.4如图所示是一样本的频率分布直方图,样本数据共分3组,分别为5,10),10,15),15,20.估计样本数据的第60百分位数是()A14 B15 C16 D17解:选A第1组5,10)的频率为0.04×50.20;第2组10,15)的频率为0.10×50.50;所以第60百分位数是105×14.5从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:排号分组频数频率10,2)60.0622,4)80.0834,6)17b46,8)220.2258,10)250.25排号分组频数频率610,12)120.12712,14)a0.06814,16)20.02916,1820.02合计1001(1)求频率分布表中a,b的值;(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.解:(1)a0.06×1006,b0.17.(2)阅读时间小于6小时的所占比例是0.060.080.170.31,阅读时间小于8小时的所占比例是0.060.080.170.220.53,所以50%分位数在6,8)内,所以50%分位数约为62×7.73.因为7.737.68,所以估计有50%的学生的阅读时间达到7.68.6已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的30百分位数、80百分位数分别相等,则等于()A B C D解:选A因为30%×61.8,大于1.8的比邻整数为2,所以30百分位数为n28,80%×64.8,大于4.8的比邻整数为5,所以80百分位数为m48,所以.故选A7将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5,10,14,15,39,41,50,已知第40百分位数是8.5,则第四个数据是()A5 B7.5 C8 D7解:选D设第四个数据为x,因为一共有10个数据,10×40%4为整数,根据百分位数的定义可得8.5,解得x7.故选D8已知一组数据按从小到大的顺序排列:11,12,15,x,17,y,22,26,经过计算,该组数据的50%分位数是16,75%分位数是20,则x_,y_解:因为50%×84,故50%分位数是(x17)÷216,解得x15.因为75%×86,故75%分位数是(y22)÷220,解得y18.9某网络营销部门随机抽查了某市200名网友在2021年11月11日的网购金额,所得数据如下表:网购金额(单位:千元)人数频率0,1)160.081,2)240.122,3)xp3,4)yq4,5)160.085,6140.07合计2001.00已知网购金额低于3千元与不低于3千元的人数比恰为32.(1)试确定x,y,p,q的值,并补全频率分布直方图(如图1);(图1) (图2)(2)估计网购金额的25%分位数(结果保留3位有效数字).解:(1)根据题意有解得所以p0.4,q0.25.补全频率分布直方图如图2所示(2)由(1)可知,网购金额低于2千元的频率为0.080.120.2,网购金额低于3千元的频率为0.20.40.6,所以网购金额的25%分位数在2,3)内,则网购金额的25%分位数估计为2×12.1252.13(千元).12学科网(北京)股份有限公司