数理统计与计量讲义幻灯片.ppt
《数理统计与计量讲义幻灯片.ppt》由会员分享,可在线阅读,更多相关《数理统计与计量讲义幻灯片.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计与计量讲义*天津港湾工程质量检测中心天津港湾工程质量检测中心1第1页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心2第2页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心3一、概率统计基础一、概率统计基础1.圆的面积圆的面积2.自由落体运动;自由落体运动;3.水的沸点摄氏水的沸点摄氏100度。度。随机事件随机事件1.抛掷硬币,出现正面还是反面?抛掷硬币,出现正面还是反面?2.车站等车人数。车站等车人数。3.抽样检验。抽样检验。必然事件必然事件随机事件也是有规律的。随机事件也是有规律的。概率统计是揭示和研究自然
2、界和人类社会中概率统计是揭示和研究自然界和人类社会中随机现象数量规律性随机现象数量规律性的一的一门学科。门学科。第3页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心4注注1:可能发生的事件的全体是确定的。:可能发生的事件的全体是确定的。注注2:试验(观察)是可重复的。:试验(观察)是可重复的。(1)不确定性不确定性在该现象发生之前,人们无法知道将会出现那一种结果;在该现象发生之前,人们无法知道将会出现那一种结果;(2)统计规律性统计规律性每一个可能结果出现的可能性的大小是确定的。每一个可能结果出现的可能性的大小是确定的。数学家皮尔逊曾投掷硬币数学家皮尔逊
3、曾投掷硬币 12000次,得正面次,得正面6019次;次;24000次,得正面次,得正面12012次。次。第4页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心5二、频率与概率的统计定义二、频率与概率的统计定义如何描述事件如何描述事件如何描述事件如何描述事件A A出现的可能性的大小?出现的可能性的大小?出现的可能性的大小?出现的可能性的大小?频率总是在某一定值附近摆动,事件频率总是在某一定值附近摆动,事件A发生的频率的稳定中发生的频率的稳定中心心P(A)称为事件称为事件A发生的发生的概率概率。注注1:频率与试验有关,但概率是该事件的客观属性。:频率与试验有
4、关,但概率是该事件的客观属性。注注2:稳定中心不是极限。:稳定中心不是极限。注注3:概率总是非负的,最大值为:概率总是非负的,最大值为1,代表必然事件,最小值为,代表必然事件,最小值为0,代表不可,代表不可能事件能事件第5页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心6三、概率的基本计算三、概率的基本计算第6页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心7第7页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心8第8页,共70页,编辑于2022年,星期六*天津港湾工程质量检测
5、中心天津港湾工程质量检测中心9四、常用的几种概率四、常用的几种概率(1).均匀分布均匀分布 第9页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心10任意一次试验中,只有事件任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分别是发生和不发生两种结果,发生的概率分别是:P和和1 P若在相同的条件下,进行若在相同的条件下,进行n次独立重复试验,用次独立重复试验,用X表示这表示这n次试验中事次试验中事件件A发生的次数,那么发生的次数,那么X服从二项分布,其概率密度函数为:服从二项分布,其概率密度函数为:(2).二项分布二项分布 第10页,共70页,编辑
6、于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心11 对于固定对于固定n及及p,当,当k增加时增加时,概率概率P(X=k)先是随之增加直至先是随之增加直至 达达到最大值到最大值,随后单调减少随后单调减少.二项分布的图形特点:二项分布的图形特点:XB(n,p)当当(n+1)p不为整数时,二项概率不为整数时,二项概率P(X=k)在在k=(n+1)p达到最大值;达到最大值;n=10,p=0.7kPk第11页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心12 正态分布是应用最广泛的一种连续型正态分布是应用最广泛的一种连续型分布分布.正态分布
7、在十九世纪前叶由高斯加以推广,所以通正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布常称为高斯分布.德莫佛最早发现了二项概率的一个近似公式,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是这一公式被认为是正态分布的首次露面正态分布的首次露面.(3).正态分布正态分布 第12页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心13正态分布的定义 若若X的的概率密度为概率密度为记作记作 f(x)所确定的曲线叫作正态曲线所确定的曲线叫作正态曲线.其中其中 和和 都是常数,都是常数,任意,任意,0,则称则称X服从参数为服从参数为 和和 的正态分布的
8、正态分布.第13页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心14 正态分布正态分布 的图形特点的图形特点 正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于 对对称的钟形曲线称的钟形曲线.特点是特点是“两头小,中间大,左右对称两头小,中间大,左右对称”.第14页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心15 决定了图形的中心位置,决定了图形的中心位置,决定了图形中峰决定了图形中峰的陡峭程度的陡峭程度.正态分布正态分布 的图形特点的图形特点第15页,共70页,编辑于2022年,星期六*天津港湾工程质量检
9、测中心天津港湾工程质量检测中心16 用用上上海海99年年年年降降雨雨量量的的数数据据画画出出了了频频率率直直方图方图.从直方图,我们可以初步看出,年降雨从直方图,我们可以初步看出,年降雨量近似服从正态分布量近似服从正态分布.第16页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心17下面是我们用某大学男大学生的身高的数下面是我们用某大学男大学生的身高的数据画出的频率直方图据画出的频率直方图.红线是拟红线是拟合的正态合的正态密度曲线密度曲线可见,某大学男大学生的身高应服可见,某大学男大学生的身高应服从正态分布从正态分布.第17页,共70页,编辑于2022年,
10、星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心18标准正态分布标准正态分布的正态分布称为标准正态分布的正态分布称为标准正态分布.第18页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心19它的依据是下面的定理:它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布可以通过线性变换转化为标准正态分布.根据上面定理根据上面定理,只要将标准正态分布的分布函数制成表,就可以只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题解决一般正
11、态分布的概率计算问题.,则则 N(0,1)设设第19页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心20利用标准正态分布函数数值表,可以解决一般正利用标准正态分布函数数值表,可以解决一般正态分布的概率计算态分布的概率计算.正态分布表正态分布表表中给的是表中给的是x0时时,(x)的值的值.当当-x0时时第20页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心21若若N(0,1)若若 XN(0,1),第21页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心22五、统计的基本概念五、统
12、计的基本概念 一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象.研究对象的全体称为总体研究对象的全体称为总体(母体母体),总体中每个成员称为个体总体中每个成员称为个体.研究某批灯泡的质量研究某批灯泡的质量考察国产考察国产 轿车的质量轿车的质量1.1.总体总体第22页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心23 然而在统计研究中,人们关心总体仅仅是然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项关心其每个个体的一项(或几项或几项)数量指标和该数量指标和该数量指标在总体中的分布情况数量指标在总体中的分布情况.这时,每个个这时,每
13、个个体具有的数量指标的全体就是总体体具有的数量指标的全体就是总体.该批灯泡寿命的该批灯泡寿命的全体就是总体全体就是总体灯泡的寿命灯泡的寿命国产轿车每公里国产轿车每公里的耗油量的耗油量所有国产轿车每公里耗所有国产轿车每公里耗油量的全体就是总体油量的全体就是总体第23页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心24 为推断总体分布及各种特征,按一定规则从总体中为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为一抽取过程称为“抽样抽样”,所抽取的部分
14、个体称为,所抽取的部分个体称为样本样本.样本中所包含的个体数目称为样本中所包含的个体数目称为样本容量样本容量.从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为52.样本样本第24页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心253.总体、样本、样本值的关系总体、样本、样本值的关系总体(理论分布)总体(理论分布)?样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断总体的情况样本值,去推断总体的情况 总体分布决定了样本取值的概率规律,也就是样本取到样本值的总体分布决定了样本取值的概率规律,
15、也就是样本取到样本值的规律,因而可以由样本值去推断总体规律,因而可以由样本值去推断总体.样本是联系二者的桥梁样本是联系二者的桥梁第25页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心264.几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差样本标准差样本标准差在教程中称有偏标准差实际上,对样本容量为实际上,对样本容量为n的情况,当有平均值时,由其中的的情况,当有平均值时,由其中的n1个偏差就可以个偏差就可以推出剩下的那个偏差,因此,偏差自由度为推出剩下的那个偏差,因此,偏差自由度为n1,在公式中使用,在公式中使用n1是比较合是比较合理的,特别是
16、样本容量不大时。当样本容量很大时,使用理的,特别是样本容量不大时。当样本容量很大时,使用 n1与与n计算出的标计算出的标准差相差不大。另外,使用准差相差不大。另外,使用n1也避免了样本容量为也避免了样本容量为1时还能求出标准差的情时还能求出标准差的情况。况。极差极差第26页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心275.参数估计参数估计 无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。是总体均值的一个无偏估计量。实际中,由于样本容量有
17、限,参数估计总存在偏差,所谓的无偏只是理论意义实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计计区间估计:区间估计:根据估计量的分布规律,使得总体指标根据估计量的分布规律,使得总体指标U在在U1,U2区间的概率区间的概率 P(U1U U2)1,区间,区间U1,U2称称置信区间置信区间,1称称置信系数置信系数,称称置信度置信度(常取(常取0.05)。根据置信度求置信区间的过程就是区间估计。)。根据置信度求置信区间的过程就是区间估计。应用例子:由
18、样本均值估计总体均值的范围应用例子:由样本均值估计总体均值的范围总体总体样本样本(总体参数)(总体参数)(估计量)(估计量)第27页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心28六、常用的数理工具六、常用的数理工具1.排列图(巴雷特图、巴氏图)排列图(巴雷特图、巴氏图)功能:找出主要影响因素功能:找出主要影响因素三个分区:三个分区:A区(区(0-80),主要影响因素),主要影响因素B区(区(80-90),一般影响因素),一般影响因素C区(区(90-100),次要影响因素),次要影响因素频率由高到低频率由高到低第28页,共70页,编辑于2022年,星期
19、六*天津港湾工程质量检测中心天津港湾工程质量检测中心292.直方图直方图功能:掌握质量数据的分布和估算不合格品率功能:掌握质量数据的分布和估算不合格品率步骤:步骤:1)收集数据,不少于)收集数据,不少于50-100个个2)分析数据,计算极差)分析数据,计算极差R Xmax Xmin3)确定组数)确定组数k和组距和组距h,组数,组数k根据样本容量定,根据样本容量定,hR/(k-1)4)确定组界,对于第一组:)确定组界,对于第一组:下限:下限:Xminh/2;上限:;上限:Xminh/2;第29页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心30判断质量分布
20、形态判断质量分布形态第30页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心313.控制图(管理图)控制图(管理图)功能:是一种动态控制方法,它可以用于辨别某过功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于偶然原因引起程由于异常原因引起的变化及由于偶然原因引起的变化。的变化。原理:原理:“3 准则准则”,(三倍标准差原则):(三倍标准差原则):对于正态分布的变量,其取值几乎全部集中在对于正态分布的变量,其取值几乎全部集中在区间(概率为区间(概率为99.74):):如果没有落在这一区间,则认为出现了异常。如果没有落在这一区间,则认
21、为出现了异常。应用方法:以下控制线应用方法:以下控制线UCL和上控制线和上控制线LCL取代取代 以中线以中线CL取代取代中线中线CL,下控制线,下控制线UCL和上控制线和上控制线LCL,为为 和和 的函数,应注意:的函数,应注意:批平均值的均值,不是整体均值批级差的均值,不是整体级差第31页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心32七、抽样检验与评定七、抽样检验与评定1.计数一次抽检计数一次抽检评定标准:评定标准:数量数量基本思想基本思想:从从N件(不合格品数为件(不合格品数为D)抽取)抽取n件,规定件,规定n件中允许不合格数上限为件中允许不合格
22、数上限为c,当不合格品数量,当不合格品数量d小于或者等于小于或者等于c时,认为时,认为N件产品都合格,否则不合格。件产品都合格,否则不合格。表示方法:表示方法:(N,n,c)接收概率:接收概率:精确方法:精确方法:近似方法:近似方法:超几何分布超几何分布二项分布二项分布泊松分布泊松分布第32页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心33抽样特征曲线:抽样特征曲线:接收概率和产品不合格率之间的关系曲线。接收概率和产品不合格率之间的关系曲线。1.总是单调递减的,左高右低总是单调递减的,左高右低2.越陡峭,抽样方案越严,越平坦,方案越宽松越陡峭,抽样方案
23、越严,越平坦,方案越宽松两种错误:两种错误:1.第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为率记为2.第二种错误,将不合格产品判为合格,对使用方不利,使用第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为风险,其概率记为第33页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心342.计量一次抽检计量一次抽检评定标准:评定标准:统计特征量统计特征量基本思想基本思想:从如果总体为正态分布,从如果总体为正态分布,则样本为正态分布,则样本为正态分布标准差已知的一
24、次抽样方案标准差已知的一次抽样方案:最好的抽检方案,相同的样本容量最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需要较少,得到最好的检验效果;相同的检验效果,只需要较少的样本容量的样本容量n。根据第一种错误概率根据第一种错误概率,第二种错误概率,第二种错误概率,以及参数,以及参数m0,m1,求出样本,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格格标准差未知的一次抽样方案标准差未知的一次抽样方案:适用性较好;检验效果随适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方
25、案相同的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,的效果,n要增至(要增至(1k2/2)倍()倍(k是合格判定系数)是合格判定系数)第34页,共70页,编辑于2022年,星期六*天津港湾工程质量检测中心天津港湾工程质量检测中心35八、一元线性回归八、一元线性回归1.线性回归的定义:线性回归的定义:有些情况下,变量之间有确定的关系,可以用精确的表有些情况下,变量之间有确定的关系,可以用精确的表示方法来表述,但对大多数情况,变量之间存在虽有某示方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法来描种关系,但这种关系很难找到一种精确的表示方法来描
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 计量 讲义 幻灯片
限制150内