2023年统计案例分析及典型例题.pdf
《2023年统计案例分析及典型例题.pdf》由会员分享,可在线阅读,更多相关《2023年统计案例分析及典型例题.pdf(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习必备 欢迎下载 统计案例分析及典型例题 11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中 200 个零件并测量了其长度,在这个问题中,总体的一个样本是 .答案 200 个零件的长度 2.某城区有农民、工人、知识分子家庭共计 2 004 户,其中农民家庭 1 600 户,工人家庭 303 户,现要从中抽取容量为 40 的样本,则在整个抽样过程中,可以用到下列抽样方法:简单随机抽样,系统抽样,分层抽样中的 .答案 3.某企业共有职工150 人,其中高级职称 15 人,中级职称 45 人,初级职称 90 人.现采用分层抽样抽取容量为 30 的样本,则抽取的各职称的人数分别为 .答
2、案 3,9,18 4.某工厂生产 A、B、C三种不同型号的产品,其相应产品数量之比为 235,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A型号产品有 16 件,那么此样本的容量 n=.答案 80 例 1 某大学为了支援我国西部教育事业,决定从 2007 应届毕业生报名的 18 名志愿者中,选取 6 人组成志愿小组.请 用抽签法和随机数表法设计抽样方案.解 抽签法:第一步:将 18 名志愿者编号,编号为 1,2,3,18.第二步:将 18 个号码分别写在 18 张外形完全相同的纸条上,并揉成团,制成号签;第三步:将 18 个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取
3、 6 个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:基础自测 学习必备 欢迎下载 第一步:将 18 名志愿者编号,编号为 01,02,03,18.第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第 8 行第 29 列的数 7 开始,向右读;第三步:从数 7 开始,向右读,每次取两位,凡不在 0118 中的数,或已读过的数,都跳过去不作记录,依次可得到 12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例 2 某工厂有 1 003 名工人,从中抽取 10 人参加体检,试用系统抽样进行具体实施.解 (1)将
4、每个人随机编一个号由 0001 至 1003.(2)利用随机数法找到 3 个号将这 3 名工人剔除.(3)将剩余的 1 000 名工人重新随机编号由 0001 至 1000.(4)分段,取间隔 k=100001=100 将总体均分为 10 段,每段含 100 个工人.(5)从第一段即为 0001 号到 0100 号中随机抽取一个号 l.(6)按编号将 l,100+l,200+l,,900+l 共 10 个号码选出,这 10 个号码所对应的工人组成样本.例 3 (14 分)某一个地区共有 5 个乡镇,人口 3 万人,其中人口比例为 32523,从 3 万人中抽取一个 300 人 的样本,分析某种
5、疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3 分 过程如下:(1)将 3 万人分为五层,其中一个乡镇为一层.5 分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300153=60(人);300152=40(人);300155=100(人);300152=40(人);300153=60(人),10 分 因此各乡镇抽取人数分别为60 人,40 人,100 人,40 人,60 人.12 分(3)将 300 人组到一起即得到一个样本.14 分 练习:一、填空题 家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可
6、以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 1.(安庆模拟)某校高中生共有 900 人,其中高一年级 300 人,高二年级 200 人,高三年级 400 人,现分层抽取容量为 45 的样本,那么高一、高二、高三年级抽取的人数分别为 .答案 15,10,20 2.某牛奶生产线上每隔 30 分钟抽取一袋进行检验,则该抽样方法为;从某中学的 30 名数学爱好者中抽取 3 人了解学习负担情况,则该抽样方法为.那么,分别为 .答案 系统抽样,简单随机抽样 3.下列抽样实验中,最适宜用系统抽样的是 (填序
7、号).某市的 4 个区共有 2 000 名学生,且 4 个区的学生人数之比为 3282,从中抽取 200 人入样 某厂生产的 2 000 个电子元件中随机抽取 5 个入样 从某厂生产的 2 000 个电子元件中随机抽取 200 个入样 从某厂生产的 20 个电子元件中随机抽取 5 个入样 答案 4.(2013重庆文)某校高三年级有男生 500 人,女生 400 人,为了解该年级学生的健康情况,从男生中任意抽取 25 人,从女生中任意抽取 20 人进行调查,这种抽样方法是 .答案 分层抽样法 5.某中学有高一学生400 人,高二学生 300 人,高三学生 200 人,学校团委欲用分层抽样的方法抽
8、取 18名学生进行问卷调查,则下列判断不正确的是 (填序号).高一学生被抽到的概率最大 高三学生被抽到的概率最大 高三学生被抽到的概率最小 每名学生被抽到的概率相等 答案 6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40 种、10 种、30 种、20种,现从中抽取一个容量为 20 的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 6 7.(天津文,11)一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为
9、 25 的样本,应抽取超过 45 岁的职工 人.答案 10 8.将参加数学竞赛的 1 000 名学生编号如下 0001,0002,0003,1000,打算从中抽取一个容量为50 的样本,按系统抽样的方法分成 50 个部分,如果第一部分编号为 0001,0002,0020,从第一部分随机抽取一个号码为 0015,则第 40 个号码为 .家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 答案 0795 9.某政府机关有在编人员 100 人,其中
10、副处级以上干部 10 人,一般干部 70 人,工人 20 人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为 20 的样本,试确定用何种方法抽取,如何抽取?解 用分层抽样抽取.(1)20100=15,510=2,570=14,520=4 从副处级以上干部中抽取2 人,一般干部中抽取14 人,从工人中抽取4 人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2 人和 4 人;对一般干部可用随机数表法抽取 14 人.(3)将 2 人、4 人、14 人编号汇合在一起就得到了容量为 20 的样本.10.某单位有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取一个
11、容量为 n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除 1 个个体,求样本容量 n.解 总体容量为 6+12+18=36.当样本容量是 n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n,抽取工程师36n6=6n(人),抽取技术人员36n12=3n(人),抽取技工36n18=2n(人).所以 n 应是 6 的倍数,36 的约数即 n=6,12,18,36.当样本容量为(n+1)时,在总体中剔除 1 人后还剩 35 人,系统抽样的间隔为135n,因为135n必须是整数,所以 n 只能取 6,即样本容量为 6
12、.总体分布的估计与总体特征数的估计 1.一个容量为 20 的样本,已知某组的频率为 0.25,则该组的频数为 .答案 5 2.(2008山东理)右图是根据山东统计年鉴 2007中的资料作成的 1997 年至 2006 年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百基础自测 家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中
13、可以得到 1997 年至 2006 年我省城镇居民百户家庭人口数的平均数为 .答案 303.6 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是其中的一组,抽查出的个体在该组上的频率为 m,该组在频率分布直方图的高为h,则|a-b|=.答案 hm 4.(2008山东文,9)从某项综合能力测试中抽取 100 人的成绩,统计如表,则这 100 人成绩的标准差为 .分数 5 4 3 2 1 人数 20 10 30 30 10 答案 5102 5.为了了解某地区高三学生的身体发育情况,抽查了该地区100 名年龄为 17.5 岁18 岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这
14、 100 名学生中体重在56.5,64.5)的学生人数是 .答案 40 典型例题:例 1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为 5 月 1 日至 30 日,评委会把同学们上交 作品的件数按 5 天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为 234641,第三组的频数为 12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有 10 件、2 件作品获奖,问这两组哪组获奖率高?解 (1)第三组的频率为1464324=51 家庭户工人家庭户现要从中抽取容量为的
15、样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 又因为第三组的频数为 12,参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有 601464326=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为601464321=3(件),第六组的获奖率为32=96,显然第六组的获奖率高.例 4(14 分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下:甲
16、:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.解 (1)因为间隔时间相同,故是系统抽样.2 分(2)茎叶图如下:5 分(3)甲车间:平均值:1x=71(102+101+99+98+103+98+99)=100,7 分 方差:s12=71(102-100)2+(101-100)2+(99-100)23.428 6.9 分 乙车间:平均值:2x=71(110+115+90+85+75+115+110)=100,11分 方差:s22=71
17、(110-100)2+(115-100)2+(110-100)2228.571 4.13分 家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 1x=2x,s12s22,甲车间产品稳定.14 分 练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是 0.1,0.3,0.4,第一小组的频数为 5.(1)求第四小组的频率;(2)参加这次测试
18、的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.(2)设参加这次测试的学生人数是 n,则有 n=第一小组频率第一小组频数=50.1=50(人).(3)因为 0.1 50=5,0.3 50=15,0.4 50=20,0.2 50=10,即第一、第二、第三、第四小组的频数分别为 5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.练习:一、填空题 1.下列关于频率分布直方图的说法中不正确的是 .直方图的高表示取某数的频率 直方图的高表示该组上的个体在样本中出现的频率 直方图的高表示该组上的个体数与
19、组距的比值 直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 2.甲、乙两名新兵在同样条件下进行射击练习,每人打 5 发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定.家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 答案 甲 乙 4.某班 50 名学生在一次百米测试中,成绩全部介于 13 秒与 19 秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于 17
20、秒的学生人数占全班总人数的百分比为 x,成绩大于等于 15 秒且小于17 秒的学生人数为 y,则从频率分布直方图中可分析出 x 和 y 分别为 .答案 0.9,35 6.甲、乙两名同学在 5 次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩 分别是 x甲、x乙,则 x甲 x乙,比 稳定.答案 乙 甲 7.(上海,9)已知总体的各个体的值由小到大依次为 2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为 10.5.若要使该总体的方差最小,则 a、b 的取值分别是 .答案 10.5、10.5 二、解答题 10.为了了解高一学生的体能情况,某校抽取部分学生进行一分
21、钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为 24171593,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签
22、法和随机数表法设计抽样方案解学习必备 欢迎下载 391517424=0.08.又因为频率=样本容量第二小组频数,所以样本容量=第二小组频率第二小组频数=08.012=150.(2)由图可估计该学校高一学生的达标率约为 39151742391517100%=88%.(3)由已知可得各小组的频数依次为 6,12,51,45,27,9,所以前三组的频数之和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内.线性回归方程 1.下列关系中,是相关关系的为 (填序号).学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;
23、家庭的经济条件与学生的学习成绩之间的关系.答案 2.为了考察两个变量 x、y 之间的线性相关关系,甲、乙两同学各自独立地做10 次和 15 次试验,并利用最小二乘法求得回归直线分别为l1和 l2.已知在两人的试验中发现变量 x 的观测数据的平均值恰好相等,都为 s,变量 y 的观测数据的平均值也恰好相等,都为 t,那么下列说法中正确的是 (填序号).直线 l1,l2有交点(s,t)直线 l1,l2相交,但是交点未必是(s,t)直线 l1,l2由于斜率相等,所以必定平行 直线 l1,l2必定重合 答案 3.下列有关线性回归的说法,正确的是 (填序号).相关关系的两个变量不一定是因果关系 散点图能
24、直观地反映数据的相关程度 回归直线最能代表线性相关的两个变量之间的关系 任一组数据都有回归直线方程 答案 基础自测 家庭户工人家庭户现要从中抽取容量为的样本则在整个抽样过程中可以的各职称的人数分别为答案某工厂生产三种不同型号的产品其相应产品志愿者中选取人组成志愿小组请用抽签法和随机数表法设计抽样方案解学习必备 欢迎下载 4.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归直线y=bx+a 及回归系数b,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .答案 5.已知回归方程为y=0
25、.50 x-0.81,则 x=25时,y 的估计值为 .答案 11.69 例 1 下面是水稻产量与施化肥量的一组观测数据:施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解 (1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 统计 案例 分析 典型 例题
限制150内