数理统计与计量讲义精品文稿.ppt
《数理统计与计量讲义精品文稿.ppt》由会员分享,可在线阅读,更多相关《数理统计与计量讲义精品文稿.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计与计量讲义*天津港湾工程质量检测中心1第1页,本讲稿共70页*天津港湾工程质量检测中心2第2页,本讲稿共70页*天津港湾工程质量检测中心3一、概率统计基础一、概率统计基础1.圆的面积2.自由落体运动;3.水的沸点摄氏100度。随机事件1.抛掷硬币,出现正面还是反面?2.车站等车人数。3.抽样检验。必然事件随机事件也是有规律的。概率统计是揭示和研究自然界和人类社会中随机现象数量规律性的一门学科。第3页,本讲稿共70页*天津港湾工程质量检测中心4注1:可能发生的事件的全体是确定的。注2:试验(观察)是可重复的。(1)不确定性在该现象发生之前,人们无法知道将会出现那一种结果;(2)统计规律性
2、每一个可能结果出现的可能性的大小是确定的。数学家皮尔逊曾投掷硬币 12000次,得正面6019次;24000次,得正面12012次。第4页,本讲稿共70页*天津港湾工程质量检测中心5二、频率与概率的统计定义如何描述事件如何描述事件如何描述事件如何描述事件A A出现的可能性的大小?出现的可能性的大小?出现的可能性的大小?出现的可能性的大小?频率总是在某一定值附近摆动,事件A发生的频率的稳定中心P(A)称为事件A发生的概率。注1:频率与试验有关,但概率是该事件的客观属性。注2:稳定中心不是极限。注3:概率总是非负的,最大值为1,代表必然事件,最小值为0,代表不可能事件第5页,本讲稿共70页*天津港
3、湾工程质量检测中心6三、概率的基本计算第6页,本讲稿共70页*天津港湾工程质量检测中心7第7页,本讲稿共70页*天津港湾工程质量检测中心8第8页,本讲稿共70页*天津港湾工程质量检测中心9四、常用的几种概率四、常用的几种概率(1).均匀分布 第9页,本讲稿共70页*天津港湾工程质量检测中心10任意一次试验中,只有事件任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分发生和不发生两种结果,发生的概率分别是别是:P和和1 P若在相同的条件下,进行若在相同的条件下,进行n次独立重复试验,用次独立重复试验,用X表示这表示这n次试验中事件次试验中事件A发生的次数,那么发生的次数,那么X服从二项
4、分布,其概率密度函数为:服从二项分布,其概率密度函数为:(2).二项分布 第10页,本讲稿共70页*天津港湾工程质量检测中心11 对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至 达到最大值,随后单调减少.二项分布的图形特点:XB(n,p)当(n+1)p不为整数时,二项概率P(X=k)在k=(n+1)p达到最大值;n=10,p=0.7kPk第11页,本讲稿共70页*天津港湾工程质量检测中心12 正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.(3).正态分布
5、 第12页,本讲稿共70页*天津港湾工程质量检测中心13正态分布的定义 若X的概率密度为记作 f(x)所确定的曲线叫作正态曲线.其中 和 都是常数,任意,0,则称X服从参数为 和 的正态分布.第13页,本讲稿共70页*天津港湾工程质量检测中心14 正态分布 的图形特点 正态分布的密度曲线是一条关于 对称的钟形曲线.特点是特点是“两头小,中间大,左右对称两头小,中间大,左右对称”.第14页,本讲稿共70页*天津港湾工程质量检测中心15 决定了图形的中心位置,决定了图形中峰的陡峭程度.正态分布 的图形特点第15页,本讲稿共70页*天津港湾工程质量检测中心16 用上海99年年降雨量的数据画出了频率直
6、方图.从直方图,我们可以初步看出,年降雨量近似服从正态分布.第16页,本讲稿共70页*天津港湾工程质量检测中心17下面是我们用某大学男大学生的身高的数据画出的频率直方图.红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布.第17页,本讲稿共70页*天津港湾工程质量检测中心18标准正态分布标准正态分布的正态分布称为标准正态分布.第18页,本讲稿共70页*天津港湾工程质量检测中心19它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.根据上面定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则 N
7、(0,1)设第19页,本讲稿共70页*天津港湾工程质量检测中心20利用标准正态分布函数数值表,可以解决一般正态分布的概率计算.正态分布表表中给的是表中给的是x0时时,(x)的值的值.当-x0时第20页,本讲稿共70页*天津港湾工程质量检测中心21若N(0,1)若 XN(0,1),第21页,本讲稿共70页*天津港湾工程质量检测中心22五、统计的基本概念五、统计的基本概念 一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.研究某批灯泡的质量考察国产 轿车的质量1.总体第22页,本讲稿共70页*天津港湾工程质量检测中心23 然而在统计研究中,人们关心总体仅仅是
8、关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.该批灯泡寿命的全体就是总体灯泡的寿命国产轿车每公里的耗油量所有国产轿车每公里耗油量的全体就是总体第23页,本讲稿共70页*天津港湾工程质量检测中心24 为推断总体分布及各种特征,按一定规则从总体为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为这一抽取过程称为“抽样抽样”,所抽取的部分个体称为,所抽取的部分个体称为样样本本.样本中所包含的个体数目称为样本中所包含的个体数目称为
9、样本容量样本容量.从国产轿车中抽5辆进行耗油量试验样本容量为52.样本第24页,本讲稿共70页*天津港湾工程质量检测中心253.总体、样本、样本值的关系总体、样本、样本值的关系总体(理论分布)?样本 样本值 统计是从手中已有的资料-样本值,去推断总体的情况 总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁第25页,本讲稿共70页*天津港湾工程质量检测中心264.几个常见统计量样本均值样本方差样本标准差在教程中称有偏标准差实际上,对样本容量为n的情况,当有平均值时,由其中的n1个偏差就可以推出剩下的那个偏差,因此,偏差自由度为n1,在
10、公式中使用n1是比较合理的,特别是样本容量不大时。当样本容量很大时,使用 n1与n计算出的标准差相差不大。另外,使用n1也避免了样本容量为1时还能求出标准差的情况。极差第26页,本讲稿共70页*天津港湾工程质量检测中心275.参数估计参数估计 无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。本均值就是总体均值的一个无偏估计量。实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总
11、存在偏差,如何来衡量这种偏差:区间义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计估计区间估计:区间估计:根据估计量的分布规律,使得总体指标根据估计量的分布规律,使得总体指标U在在U1,U2区间的概率区间的概率 P(U1U U2)1,区间,区间U1,U2称称置信区间置信区间,1称称置信系数置信系数,称称置信度置信度(常取(常取0.05)。根据置信度求置信区间的过程就是区间估计。)。根据置信度求置信区间的过程就是区间估计。应用例子:由样本均值估计总体均值的范围应用例子:由样本均值估计总体均值的范围总体样本(总体参数)(估计量)第27页,本讲稿共70页*天津港湾工程质量检测中
12、心28六、常用的数理工具六、常用的数理工具1.排列图(巴雷特图、巴氏图)排列图(巴雷特图、巴氏图)功能:找出主要影响因素功能:找出主要影响因素三个分区:三个分区:A区(区(0-80),主要影响因素),主要影响因素B区(区(80-90),一般影响因素),一般影响因素C区(区(90-100),次要影响因素),次要影响因素频率由高到低第28页,本讲稿共70页*天津港湾工程质量检测中心292.直方图直方图功能:掌握质量数据的分布和估算不合格品率功能:掌握质量数据的分布和估算不合格品率步骤:步骤:1)收集数据,不少于)收集数据,不少于50-100个个2)分析数据,计算极差)分析数据,计算极差R Xmax
13、 Xmin3)确定组数)确定组数k和组距和组距h,组数,组数k根据样本容量定,根据样本容量定,hR/(k-1)4)确定组界,对于第一组:)确定组界,对于第一组:下限:下限:Xminh/2;上限:;上限:Xminh/2;第29页,本讲稿共70页*天津港湾工程质量检测中心30判断质量分布形态第30页,本讲稿共70页*天津港湾工程质量检测中心313.控制图(管理图)控制图(管理图)功能:是一种动态控制方法,它可以用于辨功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于别某过程由于异常原因引起的变化及由于偶然原因引起的变化。偶然原因引起的变化。原理:原理:“3 准则准则”,(三
14、倍标准差原则):(三倍标准差原则):对于正态分布的变量,其取值几乎全部集中对于正态分布的变量,其取值几乎全部集中在区间(概率为在区间(概率为99.74):):如果没有落在这一区间,则认为出现了异常。如果没有落在这一区间,则认为出现了异常。应用方法:以下控制线应用方法:以下控制线UCL和上控制线和上控制线LCL取代取代 以中线以中线CL取代取代中线中线CL,下控制线,下控制线UCL和上控制线和上控制线LCL,为为 和和 的函数,应注意:的函数,应注意:批平均值的均值,不是整体均值批级差的均值,不是整体级差第31页,本讲稿共70页*天津港湾工程质量检测中心32七、抽样检验与评定七、抽样检验与评定1
15、.计数一次抽检计数一次抽检评定标准:评定标准:数量数量基本思想基本思想:从从N件(不合格品数为件(不合格品数为D)抽取)抽取n件,规定件,规定n件中允许不合格数上限为件中允许不合格数上限为c,当不合格品数量,当不合格品数量d小于或者等于小于或者等于c时,认为时,认为N件产品都合格,否则不合格。件产品都合格,否则不合格。表示方法:表示方法:(N,n,c)接收概率:接收概率:精确方法:精确方法:近似方法:近似方法:超几何分布超几何分布二项分布二项分布泊松分布泊松分布第32页,本讲稿共70页*天津港湾工程质量检测中心33抽样特征曲线:抽样特征曲线:接收概率和产品不合格率之间的关系曲线。接收概率和产品
16、不合格率之间的关系曲线。1.总是单调递减的,左高右低总是单调递减的,左高右低2.越陡峭,抽样方案越严,越平坦,方案越宽松越陡峭,抽样方案越严,越平坦,方案越宽松两种错误:两种错误:1.第一种错误,将合格产品判为不合格,对生产方不利,生产风第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为险,其概率记为2.第二种错误,将不合格产品判为合格,对使用方不利,使用风险,第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为其概率记为第33页,本讲稿共70页*天津港湾工程质量检测中心342.计量一次抽检计量一次抽检评定标准:评定标准:统计特征量统计特征量基本思想基本思想:
17、从如果总体为正态分布,从如果总体为正态分布,则样本为正态分布,则样本为正态分布标准差已知的一次抽样方案标准差已知的一次抽样方案:最好的抽检方案,相同的样本容量最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需,得到最好的检验效果;相同的检验效果,只需要较少的样本容量要较少的样本容量n。根据第一种错误概率根据第一种错误概率,第二种错误概率,第二种错误概率,以及参数,以及参数m0,m1,求出样本,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格标准差未知的一次抽样方案标准差未知的一次抽样方案
18、:适用性较好;检验效果随适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方案的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,相同的效果,n要增至(要增至(1k2/2)倍()倍(k是合格判定系数)是合格判定系数)第34页,本讲稿共70页*天津港湾工程质量检测中心35八、一元线性回归八、一元线性回归1.线性回归的定义:线性回归的定义:有些情况下,变量之间有确定的关系,可以用精确的表示有些情况下,变量之间有确定的关系,可以用精确的表示方法来表述,但对大多数情况,变量之间存在虽有某种关方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法
19、来描述。这系,但这种关系很难找到一种精确的表示方法来描述。这种大量存在的变量间既互相联系但又不是完全确定的关系,种大量存在的变量间既互相联系但又不是完全确定的关系,称为称为相关关系相关关系.回归分析就是研究相关关系的一种重要的数理统计方法回归分析就是研究相关关系的一种重要的数理统计方法.在回归分析中在回归分析中,当变量只有两个时当变量只有两个时,称为一元回归分析称为一元回归分析;当当变量在两个以上时变量在两个以上时,称为多元回归分析称为多元回归分析.变量间成线性关系变量间成线性关系,称线性回归称线性回归,变量间不具有线性关系变量间不具有线性关系,称非线性回归称非线性回归.第35页,本讲稿共70
20、页*天津港湾工程质量检测中心362.线性回归分析的最小二乘法:线性回归分析的最小二乘法:yxo40003000200010002 4 6 8 10 从图看到从图看到,数据点大致落在一条直线附近数据点大致落在一条直线附近,这告诉我们变量这告诉我们变量x和和y之间大致可看之间大致可看作线性关系作线性关系.从图中还看到从图中还看到,这些点又不完全在一条直线上这些点又不完全在一条直线上,这表明这表明x和和y的关系的关系并没有确切到给定并没有确切到给定x就可以唯一确定就可以唯一确定y的程度的程度.假定假定y和和x之间存在如下关系:之间存在如下关系:但是由图也可以看到,并不是所有的点都在直线上,也就是说,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 计量 讲义 精品 文稿
限制150内