欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第十章 统计与成对数据的统计分析.docx

    • 资源ID:96703716       资源大小:1.75MB        全文页数:112页
    • 资源格式: DOCX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第十章 统计与成对数据的统计分析.docx

    成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468也可联系微信fjmath加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期 【标题】第十章统计与成对数据的统计分析第一节随机抽样、常用统计图表1.了解简单随机抽样的含义,掌握两种简单的抽样方法:抽签法和随机数法;了解分层随机抽样,掌握各层样本量比例分配的方法.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.2.理解统计图表的含义,能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.1.随机抽样(1)简单随机抽样定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样;常用方法:抽签法和随机数法.(2)分层随机抽样定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配;分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.2.常用统计图表(1)频率分布直方图纵轴表示频率组距,即小长方形的高频率组距;小长方形的面积组距×频率组距频率;各小长方形的面积的总和等于1.(2)频率分布表的画法第一步:求极差,决定组数和组距,组距极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(3)条形图、折线图及扇形图条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图;折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图;扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.1.判断正误.(正确的画“”,错误的画“×”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()(2)抽签法和随机数法都是简单随机抽样.()(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()答案:(1)×(2)(3)×(4)2.为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽查1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A.总体指的是该市参加升学考试的全体学生B.样本是指抽查的1 000名学生的数学成绩C.样本量指的是抽查的1 000名学生D.个体指的是抽查的1 000名学生中的每一名学生解析:B对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指抽查的1 000名学生的数学成绩,故B正确;对于C,样本量是1 000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误.3.为了推动全民读书活动再次掀起高潮,某市文化局按性别分层随机抽样的方法从该市平均月阅读量超过十万字的200名市民中抽取30人进行比赛,若30人中共有男性12人.则这200名市民中女性可能有()A.12人 B.18人C.80人D.120人解析:D所抽取的30人中,男性12人,则女性有18人,女性占总人数的183035,所以这200名市民中女性人数为200×35120.4.甲、乙、丙、丁四组人数分布如图所示,根据扇形统计图的情况可以知道丙、丁两组人数和为()A.150B.250C.300D.400解析:B甲组人数为120,占总人数的百分比为30%,总人数为120÷30%400.丙、丁两组人数和占总人数的百分比为130%7.5%62.5%,丙、丁两组人数和为400×62.5%250.5.某市交通局对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h以下的汽车有辆. 解析:由频率分布直方图可得时速在70 km/h以下的频率是(0.010.03)×100.4,所以频数是0.4×5020.答案:20抽样方法考向1简单随机抽样【例1】(1)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.02C.63D.01(2)我国古代数学名著九章算术有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1 365石解析(1)根据题意,依次读出的数据为65(舍去),72(舍去),08,02,63(舍去),14,07,02(舍去,重复),43(舍去),69(舍去),97(舍去),28(舍去),01.故选D.(2)由随机抽样的含义,该批米内夹谷约为28254×1 534169(石).答案(1)D(2)B解题技法1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考向2分层随机抽样【例2】(1)某校高一年级1 000名学生的血型情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为50的样本,则从高一年级A型血的学生中应抽取的人数是()A.11B.22C.110D.220(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件. 解析(1)由图中数据可知高一年级A型血的学生占高一年级学生总体的22%,所以抽取一个容量为50的样本,从A型血的学生中应抽取的人数是50×22%11.(2)因为样本量n60,总体容量N2004003001001 000,所以抽取比例为nN601 000350.因此应从丙种型号的产品中抽取300×35018(件).答案(1)A(2)18解题技法分层随机抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算;(2)已知某层个体数量,求总体容量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算;(3)分层随机抽样的计算应根据抽样比构造方程求解,其中,抽样比样本量总样本量各层样本数量各层个体数量.考向3分层随机抽样的平均值【例3】有4万个大于70的两位数,从中随机抽取了3 000个数,统计如下表:数据x70x7980x8990x99个数8001 300900平均数78.18591.9请根据表格中的信息,估计这4万个数的平均数约为. 解析这3 000个数的平均数为13 000×(78.1×80085×1 30091.9×900)85.23.于是用样本的平均数去估计总体的平均数,则这4万个数的平均数约为85.23.答案85.23解题技法在分层随机抽样中,如果第一层的样本量为m,平均值为x,第二层的样本量为n,平均值为y,则样本的平均值为mx+nym+n.1.甲、乙两套设备生产的同类型产品共4 800件,采用分层随机抽样的方法从中抽取一个样本量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件. 解析:由题设,抽样比为804 800160.设甲设备生产的产品为x件,则x6050,x3 000.故乙设备生产的产品总数为4 8003 0001 800.答案:1 8002.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为分. 解析:设所求平均成绩为x,由题意得50×9230×9020×x,x95.答案:95统计图表考向1扇形(饼状)图【例4】2022年7月15日,国家统计局发布了2022年上半年居民人均消费支出及构成情况如图所示,根据图中的信息,针对2022年上半年,下列结论不正确的是()A.居民在“教育文化娱乐”上的人均消费支出的占比为9.8%B.居民人均消费支出为11 440元C.居民在“居住”“生活用品及服务”“医疗保健”上的人均消费支出之和大于在“食品烟酒”上的人均消费支出D.居民在“衣着”上的人均消费支出比在“交通通信”上的人均消费支出的一半少解析对于A,由题中饼状图可知,居民在“教育文化娱乐”上的人均消费支出的占比为1(30.8%6.5%23.1%5.8%12.7%8.8%2.5%)9.8%,故A正确;对于B,居民在“其他用品及服务”上的人均消费支出为286元,占比2.5%,所以居民人均消费支出为286÷2.5%11 440(元),故B正确;对于C,居民在“居住”“生活用品及服务”“医疗保健”上的人均消费支出之和占比为23.1%5.8%8.8%37.7%,在“食品烟酒”上的人均消费支出占比为30.8%,37.7%30.8%,故C正确;对于D,居民在“衣着”上的人均消费支出的占比为6.5%,在“交通通信”上的人均消费支出的占比为12.7%,6.5%12.7%2,故D错误.故选D.答案D解题技法通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.考向2条形图与折线图【例5】(多选)人口普查是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,根据人口普查的基本情况制定社会、经济、科教等各项发展政策.截至2022年6月,我国共进行了七次人口普查,下图是这七次人口普查的城乡人口数和城镇人口比重情况,下列说法正确的是()A.乡村人口数逐次增加B.历次人口普查中第七次普查城镇人口最多C.城镇人口数逐次增加D.城镇人口比重逐次增加解析对于A,根据题中条形图,知乡村人口数在前四次普查中逐次增加,在后三次普查中逐次减少,故A不正确;对于B,从题中条形图,知在历次人口普查中第七次普查城镇人口最多,故B正确;对于C,根据题中条形图,知城镇人口数逐次增加,故C正确;对于D,从题中折线图对应的数据可得,七次人口普查中城镇人口比重依次为13.26,18.30,20.91,26.44,36.22,49.68,63.89,可知城镇人口比重逐次增加,故D正确.故选B、C、D.答案BCD解题技法折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.考向3频率分布直方图【例6】随机抽取100名学生,测得他们的身高(单位: cm),按照区间160,165),165,170),170,175),175,180),180,185分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm及以上的学生人数;(2)将身高在170,175),175,180),180,185区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.解(1)由频率分布直方图可知5×(0.07x0.040.020.01)1,解得x0.06,身高在170 cm及以上的学生人数为100×5×(0.060.040.02)60.(2)A组人数为100×5×0.0630,B组人数为100×5×0.0420,C组人数为100×5×0.0210,由题意可知A组抽取人数为30×630+20+103,B组抽取人数为20×630+20+102,C组抽取人数为10×630+20+101.解题技法频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1;(2)频率分布直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积;(3)频率分布直方图中每组样本的频数为频率×总数.1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为()A.100,20B.200,20C.200,10D.100,10解析:B由题图甲可知学生总数是10 000,样本量为10 000×2%200,高中生为2 000×2%40人,由题图乙可知高中生近视率为50%,所以人数为40×50%20.2.某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2022年1月至2022年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了如图所示的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8、9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳解析:D由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.3.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图回答下列问题:(1)25,30)年龄组对应小矩形的高度是多少?(2)据此估计该市“四城同创”活动中志愿者年龄在25,35)内的人数是多少?解:(1)设25,30)年龄组对应小矩形的高度为h,则5×(0.01h0.070.060.02)1,解得h0.04.(2)志愿者年龄在25,35)内的频率为5×(0.040.07)0.55,故志愿者年龄在25,35)内的人数约为0.55×800440.1.“嫦娥五号”的成功发射,实现了中国航天史上的五个“首次”.某中学为此举行了“讲好航天故事”的主题演讲比赛.若将报名的30位同学编号为01,02,30,经随机模拟产生了36个随机数如下,则选出来的第7个个体的编号为()456732121231020104521520011251293204923449358200362348696938748146527364A.12B.20C.29D.23解析:C有效编号为:12,02,01,04,15,20,29,得到选出来的第7个个体的编号为29.故选C.2.为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一学生的身高解析:B总体是240名高一学生的身高,则个体是每名高一学生的身高,故样本是抽取的40名高一学生的身高.故选B.3.已知某居民小区户主人数和户主对户型结构的满意率分别如图和图所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()A.240,18B.200,20C.240,20D.200,18解析:A样本量n(250150400)×30%240,抽取的户主对四居室满意的人数为150×30%×40%18.4.某校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则这两个数学建模兴趣班所有同学的平均成绩是()A.85分B.85.5分C.86分D.86.5分解析:A由题意可知,两个数学建模兴趣班所有同学的平均成绩为40×90+50×819085(分).故选A.5.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制成如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80100分的学生人数是()A.15B.18C.20D.25解析:A由频率分布直方图知,第二小组的频率为10×0.0400.4,总人数为400.4100,又成绩在80100分的频率为10×(0.0100.005)0.15,成绩在80100分的学生人数为100×0.1515.6.为了比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述错误的是()A.甲的逻辑推理能力指标值高于乙的逻辑推理能力指标值B.甲的直观想象能力指标值高于乙的数学建模能力指标值C.乙的六维能力指标值整体水平高于甲的六维能力指标值整体水平D.甲的数学运算能力指标值高于甲的直观想象能力指标值解析:D对于选项A,甲的逻辑推理能力指标值为4,高于乙的逻辑推理能力指标值3,故A正确;对于选项B,乙的数学建模能力指标值为4,甲的直观想象能力指标值为5,所以甲的直观想象能力指标值高于乙的数学建模能力指标值,故B正确;对于选项C,甲的六维能力指标值的平均值为16×(434534)236,乙的六维能力指标值的平均值为16×(543543)4,2364,故C正确;对于选项D,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不高于甲的直观想象能力指标值,故D错误.故选D.7.在九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少解析:B由分层随机抽样可知,抽样比为100560+350+18010109,则甲应付10109×5605141109(钱);乙应付10109×3503212109(钱);丙应付10109×1801656109(钱).三者中甲付的钱最多,丙付的钱最少,所以A、C、D均正确,B错误.故选B.8.(多选)某学校为调查学生在一周生活方面的支出情况,抽取了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在50,60元的学生有60人,则下列说法正确的是()A.样本中支出在50,60元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2 000名学生,则一定有600人的支出在50,60元解析:BC在A中,样本中支出在50,60元的频率为1(0.0100.0240.036)×100.3,故A错误;在C中,n600.03×10200,故n的值为200,故C正确;在B中,样本中支出不少于40元的人数为200×(0.0300.036)×10132,故B正确;在D中,若该校有2 000名学生,则可能有600人的支出在50,60元,故D错误.9.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间10,110内,其频率分布直方图如图所示.已知活动时间在10,35)内的频数为80,则n的值为. 解析:根据频率分布直方图,知组距为25,所以活动时间在10,35)内的频率为0.1,因为活动时间在10,35)内的频数为80,所以n800.1800.答案:80010.某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到如图的统计图表,则样本中人数最多的是层,样本中E层的男生人数为. 解析:由图可知女生人数为60,则男生人数为40,样本中A层的人数为940×10%13;样本中B层的人数为2440×30%36;样本中C层的人数为1540×25%25;样本中D层的人数为940×20%17;样本中E层的人数为340×15%9.故样本中B层的人数最多,样本中E层的男生人数为40×15%6.答案:B611.(多选)某企业2022年12个月的收入与支出数据的折线图如图,已知:利润收入支出,根据该折线图,下列说法正确的是()A.该企业2022年1月至6月的总利润低于2022年7月至12月的总利润B.该企业2022年1月至6月的平均收入低于2022年7月至12月的平均收入C.该企业2022年8月至12月的支出持续增长D.该企业2022年11月份的月利润最大解析:ABC因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线统计图可知8月至12月的虚线是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.12.将一个总体分为A,B,C三层,其个体数之比为532.若用分层随机抽样的方法抽取容量为100的样本,则应从C中抽取个个体;若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为. 解析:A,B,C三层个体数之比为532,又有总体中每个个体被抽到的概率相等,分层随机抽样应从C中抽取100×25+3+220个个体.样本的平均数为w55+3+2×1535+3+2×3025+3+2×2020.5.答案:2020.513.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1 300样本容量(件)130由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是件. 解析:设样本容量为x,则x3 000×1 300130,x300.A产品和C产品在样本中共有300130170(件).设C产品的样本容量为y,则yy10170,y80.C产品的数量为3 000300×80800(件).答案:80014.为了对某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0m72n).(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的23,求三所高校教授的总人数.解:(1)0m72n,A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,高校B中抽取2名教授,高校A中抽取1名教授,高校C中抽取3名教授,1m2723n,解得m36,n108.(2)高校B中抽取的教授数是高校A和C中抽取的教授总数的23,23(mn)72,解得mn108,三所高校的教授的总人数为mn72180.15.为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约有1 000万人,从0岁到100岁的居民年龄结构的频率分布直方图如图所示.为了解各年龄段居民签约家庭医生的情况,现调查了1 000名年满18周岁的居民,各年龄段被访者签约率如图所示.(1)估计该城市50岁以上且已签约家庭医生的居民人数;(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的签约率提高到55%以上,应着重提高图中哪个年龄段的签约率?并根据已有数据陈述理由.解:(1)估计该城市5060岁签约的居民有1 000×0.015×10×55.7%83.55(万人);6070岁签约的居民有1 000×0.010×10×61.7%61.7(万人);7080岁签约的居民有1 000×0.004×10×70.0%28(万人);80岁以上签约的居民有1 000×0.003×10×75.8%22.74(万人).故估计该城市50岁以上且已签约家庭医生的居民有83.5561.72822.74195.99(万人).(2)由题意可估计该城市年龄在1020岁的居民有1 000×0.005×1050(万人);年龄在2030岁的居民有1 000×0.018×10180(万人).所以估计该城市居民年龄在1830岁的人数大于180万,小于230万,签约率为30.3%;估计该城市居民年龄在3050岁的有1 000×0.037×10370(万人),签约率为37.1%;估计该城市居民年龄在50岁以上的有1 000×0.032×10320(万人),签约率超过55%,上升空间不大.故由以上数据可知这个城市居民年龄在3050岁这个年龄段的人数约为370万,与其他年龄段相比人数是最多的,且签约率与55%相比较低,所以为把该城市满18周岁居民的签约率提高到55%以上,应着重提高3050岁这个年龄段的签约率.第二节用样本的数字特征估计总体1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.结合实例,能用样本估计总体的取值规律.4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.1.总体百分位数的估计(1)百分位数定义意义百分位数一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值反映该组数中小于或等于该百分位数的分布特点(2)求一组n个数据的第p百分位数的步骤第1步:按从小到大排列原始数据;第2步:计算in×p%;第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数.2.总体集中趋势的估计(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(2)众数:一组数据中出现次数最多的数据叫做这组数据的众数;(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,xn的平均数 x1n(x1x2xn).提醒(1)中位数是样本数据所占频率的等分线,不受少数极端值影响;(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,也可能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的更多信息,对样本数据中的少数极端值更加敏感.3.总体离散程度的估计(1)假设一组数据x1,x2,x3,xn的平均数为x,则:标准差s1n(x1-x)2+(x2-x)2+(xn-x)2;方差s21n(x1x)2(x2x)2(xnx)2.(2)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w,样本方差为s2.以分两层抽样的情况为例.假设第一层有m个数据分别为x1,x2,xm,平均数为x,方差为s12;第二层有n个数据,分别为y1,y2,yn,平均数为y,方差为s22.则x1mi=1mxi,s121mi=1m(xix)2,y1ni=1nyi,s221ni=1n(yiy)2.则wmm+nxnm+ny;s21m+nms12(xw)2ns22(yw)2.1.判断正误.(正确的画“”,错误的画“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()(3)方差与标准差具有相同的单位.()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()答案:(1)×(2)(3)×(4)2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:A这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是91+92291.5,平均数x87+89+90+91+92+93+94+96891.5.3.为了弘扬体育精神,某校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的第75百分位数为()A.8B.9C.8.5D.9.5解析:C由题意可得10+8+a+8+7+9+6+888,解得a8,将这组数据按从小到大的顺序排列为6,7,8,8,8,8,9,10,因为8×75%6为整数,所以这组数据的第75百分位数为8+928.5,故选C.4.(多选)下列说法正确的是()A.众数可以准确地反映出总体的情况B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大解析:CD对于A,众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得其无法客观反映总体特征,所以A错误;对于B,一组数的平均数不可能大于这组数据中的每一个数据,所以B错误;对于C,平均数、众数与中位数从不同的角度描述了一组数据的集中趋势,所以C正确;对于D,方差可以用来衡量一组数据波动的大小,方差越小,数据波动越小,方差越大,数据波动越大,所以D正确.1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形底边的中点对应的横坐标;(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广若数据x1,x2,xn的平均数为x,方差为s2,那么mx1a,mx2a,mx3a,mxna的平均数是mxa,方差为m2s2.1.(2020·全国卷)设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为()A.0.01B.0.1C.1D.10解析:C由结论2知,样本数据10x1,10x2,10xn的方差为102×0.011,故选C.2.(多选)如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是40,50),50,60),60,70),70,80),80,90),90,100,则下列说法正确的是()A.图中的x 的值为0.018B.该班50 名学生期中考试数学成绩的众数是75C.该班50 名学生期中考试数学成绩的中位数是75D.该班50 名学生期中考试数学成绩的平均数是75解析:AB由频率分布直方图可得10×(0.006×30.010x0.054)1,解得x0.018,A正确;由结论1知,数学成绩的众数是75,B正确;设中位数为a,则0.22a-7010×10×0.0540.5,解得a75.2,C错误;45×0.0655×0.0665×0.175×0.5485×0.1895×0.0674,D错误.故选A、B.总体百分位数的估计【例1】(1)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是;(结果保留两位小数) (2)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,

    注意事项

    本文(第十章 统计与成对数据的统计分析.docx)为本站会员(yz****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开