《工程统计学PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《工程统计学PPT讲稿.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、工程统计学第1页,共56页,编辑于2022年,星期六频率分布频率分布直方图直方图数数 学学 情情 景景第2页,共56页,编辑于2022年,星期六区区间间号号区区间间频频数数频频率率累累积频积频率率频频率率/组组距距1153.5157.550.05950.05950.0152157.5161.580.09520.15470.0243161.5165.5100.11900.27380.0304165.5169.5150.17860.45340.0455169.5173.5180.21430.66670.0546173.51775180.17860.84520.0457177.5181.580.09
2、520.94050.0248181.5185.550.059510.015第二步:列出频率分布表第二步:列出频率分布表第3页,共56页,编辑于2022年,星期六xy频率频率/组距组距中间高,两头低,中间高,两头低,左右大致对称左右大致对称第三步:作出频率分布直方图第三步:作出频率分布直方图第4页,共56页,编辑于2022年,星期六频率频率组距组距产品产品尺寸尺寸(mm)ab 若数据无限增多且组距无限缩小,那么若数据无限增多且组距无限缩小,那么频率分布直方图频率分布直方图的顶边缩小乃至形成一条光滑的曲线,我们称此曲线为的顶边缩小乃至形成一条光滑的曲线,我们称此曲线为概率密概率密度曲线度曲线总体在
3、区间总体在区间 内取值的概率内取值的概率概率密度曲线概率密度曲线概率密度曲线概率密度曲线的形状特征的形状特征“中间高,两头低,中间高,两头低,左右对称左右对称”正态密度曲线正态密度曲线第5页,共56页,编辑于2022年,星期六正态分布的概念和特征n概念:指变量的概念:指变量的频数或频率呈中间最多频数或频率呈中间最多,两两端端逐渐对称地减少,表现为钟形的一种概率逐渐对称地减少,表现为钟形的一种概率分布。分布。从理论上说,若随机变量从理论上说,若随机变量x的概率密度的概率密度函数为:函数为:则称则称x服从服从均数为均数为,标准差为标准差为2的正态分布。的正态分布。第6页,共56页,编辑于2022年
4、,星期六正态分布的特征n均数处最高均数处最高n以均数为以均数为中心,两端对称中心,两端对称n永远不与永远不与x轴相交的轴相交的钟型曲线钟型曲线n有两个参数:有两个参数:均数均数位置参数位置参数,标准差标准差形状(变异度)参数形状(变异度)参数。n正态曲线下的面积分布有正态曲线下的面积分布有一定规律一定规律n正态分布具有正态分布具有可加性可加性第7页,共56页,编辑于2022年,星期六正态分布的参数正态分布的参数 1 1 2 2 3 3 标准差相同、均数不同的正态分布曲线标准差相同、均数不同的正态分布曲线第8页,共56页,编辑于2022年,星期六正态曲线下面积的分布规律n正态曲线下面积的意义:正
5、态曲线下一定区间内的面积代表变量值落在该区间的概率。整个曲线下的面积为1,代表总概率为1。n曲线下面积的求法:定积分法和标准正定积分法和标准正态分布法态分布法第9页,共56页,编辑于2022年,星期六标准正态分布与正态分布的 转换n标准正态分布:指均数为0,标准差为1的正态分布。常称z分布或分布或u分布分布。n标准正态分布与正态分布的转换公式:n n即若即若x服从正态分布服从正态分布N(,2),则),则z就服从就服从均数为均数为0,标准差为,标准差为1的正态分布。的正态分布。第10页,共56页,编辑于2022年,星期六标准正态分布标准正态分布u(u)(u)的性质的性质(0)=0.5()=1(-
6、u)=1-(u)第11页,共56页,编辑于2022年,星期六正态分布曲线下的面积正态分布曲线下的面积范围内的面积为范围内的面积为68.27%1.96范围内的面积为范围内的面积为95%2.58范围内的面积占范围内的面积占99%第12页,共56页,编辑于2022年,星期六3原则原则正态总体几乎总取值于区间正态总体几乎总取值于区间 之内之内,而而在此区间以外取值的概率只有在此区间以外取值的概率只有0.26,通常认为这种通常认为这种情况在一次试验中几乎不可能发生情况在一次试验中几乎不可能发生.在在实实际际应应用用中中,通通常常认认为为服服从从于于正正态态分分布布N(,2)的的随随机机变变量量只只取取
7、之之间间的的值值,并称为并称为3原则原则 第13页,共56页,编辑于2022年,星期六n例如例如设随机变量设随机变量X N(0,1),求下列概率:,求下列概率:(1)P(X1);(2)P(X 2.77)解解解解(1)因为)因为P(X1)=1-P(X 1)=1-(1)查正态分布数值表,查正态分布数值表,(1)=0.8413所以所以P(X1)=1-(1)=0.1587(2)因为因为P(X 2.77)=1-P(X 2.77)=1-(2.77)查正态分布数值表,查正态分布数值表,(2.77)=0.9972所以所以P(X 2.77)=1-(2.77)=0.0028正态分布概率表第14页,共56页,编辑于
8、2022年,星期六 (-x)=1-(x)xpOx(-x)-x1-(x)例如例如:设随机变量设随机变量X N(0,1),求:,求:P(X-0.34)P(X-0.34)=P(X-0.34)=P(X 0.34)=1-(0.34)解解解解查正态分布数值表查正态分布数值表,(0.34)=0.6331,所以所以P(X-0.34)=1-(0.34)=0.6331=0.3669第15页,共56页,编辑于2022年,星期六 P(x1Xx2)=P(x1 X x2)=(x2)-(x1)xpOx2(x1)x1(x2)例例设随机变量设随机变量X N(0,1),求:,求:P(-1.80X2.45)因为因为P(-1.80X
9、2.45)=(2.45)-(-1.80)=(2.45)-1-(1.80)查正态分布数值表查正态分布数值表,(2.45)=0.9929,(1.80)=0.9641,所以,所以P(-1.80X2.45)=0.9929-1-0.9641=0.9570解解解解第16页,共56页,编辑于2022年,星期六 一般正态分布的概率计算一般正态分布的概率计算例:若例:若XN(5,1),求求P(6X7)P(6X7)=(7-5)-(6-5)=(2)-(1)=0.9772-0.8413 =0.1359第17页,共56页,编辑于2022年,星期六例例设随机变量服从正态分布求概率解:解:第18页,共56页,编辑于2022
10、年,星期六课堂练习:课堂练习:已知已知XN(0,1),试求:,试求:(1)P(x-1.64)?(2)P(x2.58)=?(3)P(x2.56)=?(4)P(0.34x1.53)=?第19页,共56页,编辑于2022年,星期六课堂练习:课堂练习:已知已知XN(0,1),解:解:P(x-1.64)=1-P(x 1.64)=1-0.9495=0.0505 P(x2.58)=1-P(x 2.58)=1-0.9951=0.0049第20页,共56页,编辑于2022年,星期六课堂练习:课堂练习:已知已知XN(0,1),解:解:(3)P(x2.56)=1-P(x 2.56)=1-0.9948=0.0052(
11、4)P(0.34x1.53)=P(1.53)-P(0.34)=0.9370-0.6331=0.3039第21页,共56页,编辑于2022年,星期六应用实例应用实例某机器生产的螺栓的长度(cm)服从正态分布,规定长度在范围内为正品,求产品的正品率。解故产品的正品率为第22页,共56页,编辑于2022年,星期六应用实例应用实例公共汽车车门的高度是按男子与车门碰头的机会在以下来设计的。设男子的身高问车门的高度应如何确定?解设车门高度为则故车门高度应设计为厘米。于是即由于可取第23页,共56页,编辑于2022年,星期六v正态分布表的使用v依据依据Z值求面积值求面积Pv第一:求某第一:求某Z分数与平均数
12、之间的面积。分数与平均数之间的面积。v例题:假设某年级有例题:假设某年级有2000名学生,其物理考试名学生,其物理考试成绩接近正态分布。已知平均数为成绩接近正态分布。已知平均数为80分,标准分,标准差为差为10分。分。v求:求:80分到分到90分之间的学生有多少人?分之间的学生有多少人?v60分到分到80分之间的学生有多少人?分之间的学生有多少人?第24页,共56页,编辑于2022年,星期六v解:解:Z1=(90-80)/10=1vZ2=(60-80)/10=-2v查表:查表:p1(80X90)=0.3414vP2(60X80)=0.47225vN1=20000.3414=682.68vN2=
13、20000.47725=954.5v所以,所以,80至至90分间学生大约有分间学生大约有683名,名,v60至至80分之间的学生大约有分之间的学生大约有955名。名。第25页,共56页,编辑于2022年,星期六v巩固练习假设某年级有假设某年级有2000名学生,其物理考试成绩接近正名学生,其物理考试成绩接近正态分布。已知平均分为态分布。已知平均分为80分,标准差为分,标准差为10分。分。求:求:85分以上的学生有多少人?分以上的学生有多少人?60分以上的学生有多少人?分以上的学生有多少人?答案:解:答案:解:Z1=(85-80)/10=0.5Z2=(60-80)/10=-2查表:查表:p1(X8
14、5)=1-p1(X85)=1-p1(0.5)=1-0.6915=0.30852000*0.3085=617P2(X60)=1-p1(X60)=1-p2(-2)=1-(1-p2(2)=1-(1-0.9772)=0.97722000*0.9772=1955第26页,共56页,编辑于2022年,星期六正常值范围的确定1.选定选定正常人群正常人群,并抽取,并抽取一定的样本含一定的样本含量(一般大样本)。量(一般大样本)。2.根据专业知识确定用根据专业知识确定用单侧或双侧范围。单侧或双侧范围。3.根据需要确定根据需要确定可信度可信度。第27页,共56页,编辑于2022年,星期六正常值范围的确定步骤4.按
15、资料特点按资料特点选定不同方法计算正常值范选定不同方法计算正常值范围上、下限围上、下限。n正态分布法:正态分布法:适于适于正态分布正态分布资料。对资料。对数正态分布的资料取对数后可用正态数正态分布的资料取对数后可用正态分布法估计。分布法估计。n百分位数法百分位数法:适于:适于偏态分布偏态分布资料或资料或分分布不明布不明类型的资料。所需样本含量类型的资料。所需样本含量较大较大。第28页,共56页,编辑于2022年,星期六表 正常值范围的界值 正态分布法 百分位数法双侧单 侧 双 侧单 侧下限 上限下限 上限909599 P5P95 P2.5P97.5 P0.5P99.5 P10 P90 P5 P
16、95 P1 P99第29页,共56页,编辑于2022年,星期六应用实例应用实例 调查某地120名健康女性血红蛋白,其分布近似于正态分布,(g/L),(g/L),试估计该地健康女性血红蛋白的95%参考值范围。n上限为 n下限为 第30页,共56页,编辑于2022年,星期六正态分布应用n质量控制第31页,共56页,编辑于2022年,星期六频率分布表频率分布表(直方图)【问题问题】我国是世界上严重缺水的国家之我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生了节约生活用水,计划在本市试行居民生活用水定额管理,即确定
17、一个居民月用水活用水定额管理,即确定一个居民月用水量标准量标准a a,用水量不超过,用水量不超过a a的部分按平价收的部分按平价收费,超出费,超出a a的部分按议价收费的部分按议价收费.通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的年的月均用水量如下表(单位:月均用水量如下表(单位:t t):):第32页,共56页,编辑于2022年,星期六3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.
18、3 0.43.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.
19、3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.
20、2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2(4.3-0.24.3-0.2)0.5=8.20.5=8.2思考思考2 2:样本数据中的最大值和最小值的样本数据中的最大值和最小值的差称为差称为极差极差.如果将上述如果将上述100100个数据按组个数据按组距为距为0.50.5进行分组,那么这些数据共分为进行分组,那么这些数据共分为多少组?多少组?思考思考1 1:上述上述100100个数据中的最大值和最小个数据中的最大值和最小值分别是什么?由此说明样本数据的变化值分别是什么?由此说明样本数据的变化范围是什么?范
21、围是什么?第33页,共56页,编辑于2022年,星期六思考思考3 3:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个个数据共分为数据共分为9 9组,各组数据的取值范围可组,各组数据的取值范围可以如何设定?以如何设定?思考思考4 4:如何统计上述如何统计上述100100个数据在各组中个数据在各组中的频数?如何计算样本数据在各组中的频的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?率?你能将这些数据用表格反映出来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.第34页,共56页,编辑于2022
22、年,星期六 分分 组组 频频数累数累计计 频频数数 频频率率 00,0.50.5)4 0.044 0.04 0.5 0.5,1 1)正正 8 0.088 0.08 1 1,1.51.5)正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.2222 0.22 2 2,2.52.5)正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3)正正 正正 14 0.1414 0.14 3 3,3.53.5)正正 一一 6 0.066 0.06 3.5 3.5,4 4)4 0.044 0.04 4 4,4.5 2 0.024
23、.5 2 0.02 合合计计 100 1.00100 1.00频率分布表频率分布表第35页,共56页,编辑于2022年,星期六思考思考5 5:上表称为样本数据的频率分布表,上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什量标准提供参考依据,这里体现了一种什么统计思想?么统计思想?用样本的频率分布估计总体分布用样本的频率分布估计总体分布.第36页,共56页,编辑于2022年,星期六 分分 组组 频频数累数累计计 频频数数 频频率率 00
24、,0.50.5)4 0.044 0.04 0.5 0.5,1 1)正正 8 0.088 0.08 1 1,1.51.5)正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.2222 0.22 2 2,2.52.5)正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3)正正 正正 14 0.1414 0.14 3 3,3.53.5)正正 一一 6 0.066 0.06 3.5 3.5,4 4)4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合合计计 100 1.00100 1.00思考
25、思考6 6:如果市政府希望如果市政府希望85%85%左右的居民每月的左右的居民每月的用水量不超过标准,由此表,你对制定居民月用用水量不超过标准,由此表,你对制定居民月用水量标准(即水量标准(即a a的取值)有何建议?的取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议取以下,可建议取a=3.a=3.思考思考7 7:在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上的以上的居民用水不超标吗?哪些环节可能会导致结论出居民用水不超标吗?哪些环节可能会导致结论出现偏差?现偏差?分组时,组距的大小可能会导致结论出现偏差,分组时,组距的大小可能会导
26、致结论出现偏差,实践中,对统计结论是需要进行评价的实践中,对统计结论是需要进行评价的.第37页,共56页,编辑于2022年,星期六思考思考8 8:对样本数据进行分组,其组数:对样本数据进行分组,其组数是由哪些因素确定的?是由哪些因素确定的?思考思考9 9:对样本数据进行分组,组距的确定没:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况们了解数据的分布情况.数据分组的组数与样数据分组的组数与样本容量有关,一般样本容量越大,所分组数越本容量有关,一般样本容量越大,所分组数越多多.当样本容量不超过当样本容量不超过1
27、00100时,按照数据的多时,按照数据的多少,常分成少,常分成5 51212组组.若以若以0.10.1或或1.51.5为组距对上为组距对上述述100100个样本数据分组合适吗?个样本数据分组合适吗?第38页,共56页,编辑于2022年,星期六思考思考1010:一般地,列出一组样本数据的频率分布一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?表可以分哪几个步骤进行?第一步,求极差第一步,求极差.(极差(极差=样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数.(设(设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数
28、=k=k,否则,组数,否则,组数=k+1=k+1)第三步,第三步,确定分点,将数据分组确定分点,将数据分组.第四步,第四步,统计频数,计算频率,制成表格统计频数,计算频率,制成表格.(频数(频数=样本数据落在各小组内的个数,样本数据落在各小组内的个数,频频率率=频数频数样本容量)样本容量)第39页,共56页,编辑于2022年,星期六频率分布直方图频率分布直方图 思考思考1 1:为了直观反映样本数据在各组中的分为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息布情况,我们将上述频率分布表中的有关信息用下面的图形表示:用下面的图形表示:月均用水量月均用水量/t频率频率组距组距
29、0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第40页,共56页,编辑于2022年,星期六上图称为频率分布直方图,其中横轴表示上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率月均用水量,纵轴表示频率/组距组距.频率频率分布直方图中各小长方形的和高度在数分布直方图中各小长方形的和高度在数量上有何特点?量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度宽度:组距组距
30、高度高度:频率频率组距组距第41页,共56页,编辑于2022年,星期六思考思考2 2:频率分布直方图中各小长方形的频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为面积表示什么?各小长方形的面积之和为多少?多少?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积各小长方形的面积=频率频率各小长方形的面积之和各小长方形的面积之和=1 1第42页,共56页,编辑于2022年,星期六思考思考3 3:频率分布直方图非常直观地表明了频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频
31、率样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来据不能在图中表示出来.你能根据上述频率你能根据上述频率分布直方图指出居民月均用水量的一些数分布直方图指出居民月均用水量的一些数据特点吗?据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第43页,共56页,编辑于2022年,星期六(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且是状的,而且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组
32、距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值附近,)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.第44页,共56页,编辑于2022年,星期六思考思考4 4:样本数据的频率分布直方图是根样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?布直方图的作图步骤如何?第一步,画平
33、面直角坐标系第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的组距的商为高,分别画出各组对应的小长方形小长方形.第45页,共56页,编辑于2022年,星期六思考思考5 5:对一组给定的样本数据,频率分布:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以民月均用水量样本中,你能以1 1为组距画频为组距画频率分布直方图吗?率分布直方图吗?与
34、分组数(或组距)及坐标系的单位长度与分组数(或组距)及坐标系的单位长度有关有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O第46页,共56页,编辑于2022年,星期六例题一个容量为20的样本,数据的分组及各组的频数如图,则样本在区间(10,50上的频率为()A.0.5 B.0.7 C.0.25 D.0.05解:由表格可以看出,样本在区间(10,50上共有2+3+4+5=14个数据,样本容量为20,样本在区间(10,50上的频率为:=14/20=0.7,频率频率=频数频数/数据数据总量总量第47页,共56页,
35、编辑于2022年,星期六为应对甲型为应对甲型H1N1H1N1流感第二波全球大爆发的态势,截至流感第二波全球大爆发的态势,截至20092009年年1010月月3131日,我国日,我国国家食品药品监督管理局已批准国家食品药品监督管理局已批准8 8家疫苗生产企业生产甲型家疫苗生产企业生产甲型H1N1H1N1流感疫苗流感疫苗为了调查这些企业的生产能力,随机抽查了其中一个企业为了调查这些企业的生产能力,随机抽查了其中一个企业2020天每天生产天每天生产甲型甲型H1N1H1N1流感疫苗的数量流感疫苗的数量(单位:万剂单位:万剂),疫苗数量的分组区间为,疫苗数量的分组区间为4545,5555,5555,65
36、65,6565,7575,7575,8585,8585,9595,由此得到频率分布直方,由此得到频率分布直方图如图,则由此估计该企业一个月图如图,则由此估计该企业一个月(以以3030天计算天计算)生产产品数量在生产产品数量在6565万剂以万剂以上的天数约为上的天数约为_解析解析:由频率分布直方图知疫苗生产数量在由频率分布直方图知疫苗生产数量在65万剂万剂以上的有三组,这三组的频率比组距之和是以上的有三组,这三组的频率比组距之和是0.025+0.010+0.005,组距是,组距是10,得到三组的频,得到三组的频率之和是率之和是0.04010,用频率乘以全体数得到要,用频率乘以全体数得到要求的频数
37、求的频数解:由频率分布直方图知疫苗生产数量在解:由频率分布直方图知疫苗生产数量在65万万剂以上的有三组,剂以上的有三组,这三组的频率比组距之和是这三组的频率比组距之和是0.025+0.010+0.005=0.040,组距是组距是10,三组的频率之和是三组的频率之和是0.04010=0.4,生产产品数量在生产产品数量在65万剂以上的天数约为万剂以上的天数约为300.4=12第48页,共56页,编辑于2022年,星期六已知一组数据有已知一组数据有40个,把它分成六组,第一组个,把它分成六组,第一组到第四组的频数分别是到第四组的频数分别是10,5,7,6,第五组的,第五组的频率是频率是0.2,则第六
38、组的频率是,则第六组的频率是()解:前四组的频率是:解:前四组的频率是:28/40=0.7总频率为总频率为1=0.7+0.2+xx=0.1第49页,共56页,编辑于2022年,星期六O0.050.100.150.40123456 数据数据某个容量为100的样本的频率分布直方图如右,则在区间4,5)上的数据的频数为 第50页,共56页,编辑于2022年,星期六巩固巩固练习练习为了了解一批灯泡为了了解一批灯泡 (共共 10000 10000 只只 )的使用寿命的使用寿命 ,从中从中抽取了抽取了 100 100 只进行测试只进行测试 ,其使用寿命如下表其使用寿命如下表 :(1)(1)制作频率分布表制
39、作频率分布表 ;(2)(2)绘制频率分布直方图绘制频率分布直方图 ;(3)(3)根据样本的频率分布根据样本的频率分布 ,估计使用寿命不低于估计使用寿命不低于 1000/h 1000/h 的灯泡约有多少只的灯泡约有多少只?第51页,共56页,编辑于2022年,星期六解解 :(1)(1)频率分布表为频率分布表为 :第52页,共56页,编辑于2022年,星期六(2)(2)频率分布直方图为频率分布直方图为:全距全距=1400-500=900,=1400-500=900,分组分组1010,组距,组距=100=100(3)(3)因为使用寿命不低于因为使用寿命不低于 1000/h 1000/h 的频率为的频率为0.24+0.28,0.24+0.28,所以估计不低于所以估计不低于 1000/h 1000/h 的灯泡约有的灯泡约有 5200 5200 只只 .第53页,共56页,编辑于2022年,星期六直方图54作成直方图后、可以知道数据的分布状況直方图是将数据的偏差通过可视化,把握整体数据特征的手法。B農園直方图:草莓的含糖程度不同水果的甜分比较改良后、草莓变甜了土壤改良前土壤改良后数量数量第54页,共56页,编辑于2022年,星期六CTRL+SHIFT+ENTER第55页,共56页,编辑于2022年,星期六第56页,共56页,编辑于2022年,星期六
限制150内