第十章 统计与成对数据的统计分析.docx
《第十章 统计与成对数据的统计分析.docx》由会员分享,可在线阅读,更多相关《第十章 统计与成对数据的统计分析.docx(112页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468也可联系微信fjmath加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期 【标题】第十章统计与成对数据的统计分析第一节随机抽样、常用统计图表1.了解简单随机抽样的含义,掌握两种简单的抽样方法:抽签法和随机数法;了解分层随机抽样,掌握各层样本量比例分配的方法.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.2.理解统计图表的含义,能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.1.随机抽样(1)简单随机抽样定义:一般地,设一个
2、总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样;常用方法:抽签法和随机数法.(2)分层随机抽样定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随
3、机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配;分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.2.常用统计图表(1)频率分布直方图纵轴表示频率组距,即小长方形的高频率组距;小长方形的面积组距频率组距频率;各小长方形的面积的总和等于1.(2)频率分布表的画法第一步:求极差,决定组数和组距,组距极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(3)条形图、折线图及扇形图条形图:建立直角坐标系,用横轴(横轴上的数字)表示
4、样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图;折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图;扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.1.判断
5、正误.(正确的画“”,错误的画“”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()(2)抽签法和随机数法都是简单随机抽样.()(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()答案:(1)(2)(3)(4)2.为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽查1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A.总体指的是该市参加升学考试的全体学生B.样本是指抽查的1 000名学生的数学成绩C.样本量指的是抽查的1 000名学生D.个体指
6、的是抽查的1 000名学生中的每一名学生解析:B对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指抽查的1 000名学生的数学成绩,故B正确;对于C,样本量是1 000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误.3.为了推动全民读书活动再次掀起高潮,某市文化局按性别分层随机抽样的方法从该市平均月阅读量超过十万字的200名市民中抽取30人进行比赛,若30人中共有男性12人.则这200名市民中女性可能有()A.12人 B.18人C.80人D.120人解析:D所抽取的30人中,男性12人,则女性有18人,女性占总人数的183035,所以这200名市民中
7、女性人数为20035120.4.甲、乙、丙、丁四组人数分布如图所示,根据扇形统计图的情况可以知道丙、丁两组人数和为()A.150B.250C.300D.400解析:B甲组人数为120,占总人数的百分比为30%,总人数为12030%400.丙、丁两组人数和占总人数的百分比为130%7.5%62.5%,丙、丁两组人数和为40062.5%250.5.某市交通局对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h以下的汽车有辆.解析:由频率分布直方图可得时速在70 km/h以下的频率是(0.010.03)100.4,所
8、以频数是0.45020.答案:20抽样方法考向1简单随机抽样【例1】(1)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.02C.63D.01(2)我国古代数学名著九章算术有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石
9、B.169石C.338石D.1 365石解析(1)根据题意,依次读出的数据为65(舍去),72(舍去),08,02,63(舍去),14,07,02(舍去,重复),43(舍去),69(舍去),97(舍去),28(舍去),01.故选D.(2)由随机抽样的含义,该批米内夹谷约为282541 534169(石).答案(1)D(2)B解题技法1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考向2分层随机抽样【例2】(1)某校高一年级1 000
10、名学生的血型情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为50的样本,则从高一年级A型血的学生中应抽取的人数是()A.11B.22C.110D.220(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.解析(1)由图中数据可知高一年级A型血的学生占高一年级学生总体的22%,所以抽取一个容量为50的样本,从A型血的学生中应抽取的人数是5022%11.(2)因为样本量n60,总体容量N20040
11、03001001 000,所以抽取比例为nN601 000350.因此应从丙种型号的产品中抽取30035018(件).答案(1)A(2)18解题技法分层随机抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算;(2)已知某层个体数量,求总体容量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算;(3)分层随机抽样的计算应根据抽样比构造方程求解,其中,抽样比样本量总样本量各层样本数量各层个体数量.考向3分层随机抽样的平均值【例3】有4万个大于70的两位数,从中随机抽取了3 000个数,统计如下表:数据x70x7980x8990x99个数8001 300900平均数
12、78.18591.9请根据表格中的信息,估计这4万个数的平均数约为.解析这3 000个数的平均数为13 000(78.1800851 30091.9900)85.23.于是用样本的平均数去估计总体的平均数,则这4万个数的平均数约为85.23.答案85.23解题技法在分层随机抽样中,如果第一层的样本量为m,平均值为x,第二层的样本量为n,平均值为y,则样本的平均值为mx+nym+n.1.甲、乙两套设备生产的同类型产品共4 800件,采用分层随机抽样的方法从中抽取一个样本量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.解析:由题设,抽样比为804 8001
13、60.设甲设备生产的产品为x件,则x6050,x3 000.故乙设备生产的产品总数为4 8003 0001 800.答案:1 8002.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为分.解析:设所求平均成绩为x,由题意得5092309020x,x95.答案:95统计图表考向1扇形(饼状)图【例4】2022年7月15日,国家统计局发布了2022年上半年居民人均消费支出及构成情况如图所示,根据图中的信息,针对2022年上半年,下列结论不正确的是()A.居民在“教育文化娱乐”上的人均消费支出的占比为9.8%B.居民人均消费支出为11 4
14、40元C.居民在“居住”“生活用品及服务”“医疗保健”上的人均消费支出之和大于在“食品烟酒”上的人均消费支出D.居民在“衣着”上的人均消费支出比在“交通通信”上的人均消费支出的一半少解析对于A,由题中饼状图可知,居民在“教育文化娱乐”上的人均消费支出的占比为1(30.8%6.5%23.1%5.8%12.7%8.8%2.5%)9.8%,故A正确;对于B,居民在“其他用品及服务”上的人均消费支出为286元,占比2.5%,所以居民人均消费支出为2862.5%11 440(元),故B正确;对于C,居民在“居住”“生活用品及服务”“医疗保健”上的人均消费支出之和占比为23.1%5.8%8.8%37.7%
15、,在“食品烟酒”上的人均消费支出占比为30.8%,37.7%30.8%,故C正确;对于D,居民在“衣着”上的人均消费支出的占比为6.5%,在“交通通信”上的人均消费支出的占比为12.7%,6.5%12.7%2,故D错误.故选D.答案D解题技法通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.考向2条形图与折线图【例5】(多选)人口普查是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,根据人口普查的基本情况制定社会、经济、科教等各项发展政策.截至2022年6月,我国共进行了七次人口普查,下图是这七次人口普查的城乡人口数和城镇人口比重情况,下列说法正确的是()A.乡村人口数逐次
16、增加B.历次人口普查中第七次普查城镇人口最多C.城镇人口数逐次增加D.城镇人口比重逐次增加解析对于A,根据题中条形图,知乡村人口数在前四次普查中逐次增加,在后三次普查中逐次减少,故A不正确;对于B,从题中条形图,知在历次人口普查中第七次普查城镇人口最多,故B正确;对于C,根据题中条形图,知城镇人口数逐次增加,故C正确;对于D,从题中折线图对应的数据可得,七次人口普查中城镇人口比重依次为13.26,18.30,20.91,26.44,36.22,49.68,63.89,可知城镇人口比重逐次增加,故D正确.故选B、C、D.答案BCD解题技法折线图可以显示随时间(根据常用比例放置)而变化的连续数据,
17、因此非常适用于显示在相等时间间隔下数据的变化趋势.考向3频率分布直方图【例6】随机抽取100名学生,测得他们的身高(单位: cm),按照区间160,165),165,170),170,175),175,180),180,185分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm及以上的学生人数;(2)将身高在170,175),175,180),180,185区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.解(1)由频率分布直方图可知5(0.07x0.040.020.01)1,解得x0.06,
18、身高在170 cm及以上的学生人数为1005(0.060.040.02)60.(2)A组人数为10050.0630,B组人数为10050.0420,C组人数为10050.0210,由题意可知A组抽取人数为30630+20+103,B组抽取人数为20630+20+102,C组抽取人数为10630+20+101.解题技法频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1;(2)频率分布直方图中纵轴表示频率组距,故每组样本的频率为组距频率组距,即矩形的面积;(3)频率分布直方图中每组样本的频数为频率总数.1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小
19、学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为()A.100,20B.200,20C.200,10D.100,10解析:B由题图甲可知学生总数是10 000,样本量为10 0002%200,高中生为2 0002%40人,由题图乙可知高中生近视率为50%,所以人数为4050%20.2.某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2022年1月至2022年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了如图所示的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程
20、逐月增加C.月跑步平均里程高峰期大致在8、9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳解析:D由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.3.对某市“四城同创
21、”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图回答下列问题:(1)25,30)年龄组对应小矩形的高度是多少?(2)据此估计该市“四城同创”活动中志愿者年龄在25,35)内的人数是多少?解:(1)设25,30)年龄组对应小矩形的高度为h,则5(0.01h0.070.060.02)1,解得h0.04.(2)志愿者年龄在25,35)内的频率为5(0.040.07)0.55,故志愿者年龄在25,35)内的人数约为0.55800440.1.“嫦娥五号”的成功发射,实现了中国航天史上的五个“首次”.某中学为此举行了“讲好航天故事”的
22、主题演讲比赛.若将报名的30位同学编号为01,02,30,经随机模拟产生了36个随机数如下,则选出来的第7个个体的编号为()456732121231020104521520011251293204923449358200362348696938748146527364A.12B.20C.29D.23解析:C有效编号为:12,02,01,04,15,20,29,得到选出来的第7个个体的编号为29.故选C.2.为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 统计 成对 数据 统计分析
限制150内