数理统计与计量讲义.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数理统计与计量讲义.pptx》由会员分享,可在线阅读,更多相关《数理统计与计量讲义.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、19:331一、概率统计基础1.圆的面积2.自由落体运动;3.水的沸点摄氏100度。随机事件1.抛掷硬币,出现正面还是反面?2.车站等车人数。3.抽样检验。必然事件随机事件也是有规律的。概率统计是揭示和研究自然界和人类社会中随机现象数量规律性的一门学科。第1页/共69页19:332注1:可能发生的事件的全体是确定的。注2:试验(观察)是可重复的。(1)不确定性在该现象发生之前,人们无法知道将会出现那一种结果;(2)统计规律性每一个可能结果出现的可能性的大小是确定的。数学家皮尔逊曾投掷硬币 12000次,得正面6019次;24000次,得正面12012次。第2页/共69页19:333二、频率与概
2、率的统计定义如何描述事件如何描述事件A A出现的可能性的大小?出现的可能性的大小?频率总是在某一定值附近摆动,事件A发生的频率的稳定中心P(A)称为事件A发生的概率。注1:频率与试验有关,但概率是该事件的客观属性。注2:稳定中心不是极限。注3:概率总是非负的,最大值为1,代表必然事件,最小值为0,代表不可能事件第3页/共69页19:334三、概率的基本计算第4页/共69页19:335第5页/共69页19:336第6页/共69页19:337四、常用的几种概率(1).均匀分布 第7页/共69页19:338任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分别是:P和1 P若在相同的条件下,
3、进行n次独立重复试验,用X表示这n次试验中事件A发生的次数,那么X服从二项分布,其概率密度函数为:(2).二项分布 第8页/共69页19:339 对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至 达到最大值,随后单调减少.二项分布的图形特点:XB(n,p)当(n+1)p不为整数时,二项概率P(X=k)在k=(n+1)p达到最大值;n=10,p=0.7kPk第9页/共69页19:3310 正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.(3).正态分布 第10
4、页/共69页19:3311正态分布的定义 若X的概率密度为记作 f(x)所确定的曲线叫作正态曲线.其中 和 都是常数,任意,0,则称X服从参数为 和 的正态分布.第11页/共69页19:3312 正态分布 的图形特点 正态分布的密度曲线是一条关于 对称的钟形曲线.特点是“两头小,中间大,左右对称”.第12页/共69页19:3313 决定了图形的中心位置,决定了图形中峰的陡峭程度.正态分布 的图形特点第13页/共69页19:3314 用上海99年年降雨量的数据画出了频率直方图.从直方图,我们可以初步看出,年降雨量近似服从正态分布.第14页/共69页19:3315下面是我们用某大学男大学生的身高的
5、数据画出的频率直方图.红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布.第15页/共69页19:3316标准正态分布的正态分布称为标准正态分布.第16页/共69页19:3317它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.根据上面定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则 N(0,1)设第17页/共69页19:3318利用标准正态分布函数数值表,可以解决一般正态分布的概率计算.正态分布表表中给的是x0时,(x)的值.当-x0时第18页/共69页19:3319若N(0,1)若
6、XN(0,1),第19页/共69页19:3320五、统计的基本概念 一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.研究某批灯泡的质量考察国产 轿车的质量1.总体第20页/共69页19:3321 然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.该批灯泡寿命的全体就是总体灯泡的寿命国产轿车每公里的耗油量所有国产轿车每公里耗油量的全体就是总体第21页/共69页19:3322 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总
7、体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.从国产轿车中抽5辆进行耗油量试验样本容量为52.样本第22页/共69页19:33233.总体、样本、样本值的关系总体(理论分布)?样本 样本值 统计是从手中已有的资料-样本值,去推断总体的情况 总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁第23页/共69页19:33244.几个常见统计量样本均值样本方差样本标准差在教程中称有偏标准差实际上,对样本容量为n的情况,当有平均值时,由其中的n1个偏差就可以推出剩下的那个偏差,因此,偏差自由
8、度为n1,在公式中使用n1是比较合理的,特别是样本容量不大时。当样本容量很大时,使用 n1与n计算出的标准差相差不大。另外,使用n1也避免了样本容量为1时还能求出标准差的情况。极差第24页/共69页19:33255.参数估计 无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计区间估计:根据估计量的分布规律,使得总体指标U在U1,U2区间的概率 P(U1U U2)1,区间U1,U2称置信区间,1称置信系数,称置信度(
9、常取0.05)。根据置信度求置信区间的过程就是区间估计。应用例子:由样本均值估计总体均值的范围总体样本(总体参数)(估计量)第25页/共69页19:3326六、常用的数理工具1.排列图(巴雷特图、巴氏图)功能:找出主要影响因素三个分区:A区(0-80),主要影响因素B区(80-90),一般影响因素C区(90-100),次要影响因素频率由高到低第26页/共69页19:33272.直方图功能:掌握质量数据的分布和估算不合格品率步骤:1)收集数据,不少于50-100个2)分析数据,计算极差R Xmax Xmin3)确定组数k和组距h,组数k根据样本容量定,hR/(k-1)4)确定组界,对于第一组:下
10、限:Xminh/2;上限:Xminh/2;第27页/共69页19:3328判断质量分布形态第28页/共69页19:33293.控制图(管理图)功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于偶然原因引起的变化。原理:“3 准则”,(三倍标准差原则):对于正态分布的变量,其取值几乎全部集中在区间(概率为99.74):如果没有落在这一区间,则认为出现了异常。应用方法:以下控制线UCL和上控制线LCL取代 以中线CL取代中线CL,下控制线UCL和上控制线LCL,为 和 的函数,应注意:批平均值的均值,不是整体均值批级差的均值,不是整体级差第29页/共69页19:3330七、
11、抽样检验与评定1.计数一次抽检评定标准:数量基本思想:从N件(不合格品数为D)抽取n件,规定n件中允许不合格数上限为c,当不合格品数量d小于或者等于c时,认为N件产品都合格,否则不合格。表示方法:(N,n,c)接收概率:精确方法:近似方法:超几何分布二项分布泊松分布第30页/共69页19:3331抽样特征曲线:接收概率和产品不合格率之间的关系曲线。1.总是单调递减的,左高右低2.越陡峭,抽样方案越严,越平坦,方案越宽松两种错误:1.第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为2.第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为第31页/共69页19:
12、33322.计量一次抽检评定标准:统计特征量基本思想:从如果总体为正态分布,则样本为正态分布标准差已知的一次抽样方案:最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需要较少的样本容量n。根据第一种错误概率,第二种错误概率,以及参数m0,m1,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格标准差未知的一次抽样方案:适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,n要增至(1k2/2)倍(k是合格判定系数)第32页/共69页19:3333八、一元线性回归1.线性回归的定义:有些情况下,变量之间有确定的关系,可以用精
13、确的表示方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法来描述。这种大量存在的变量间既互相联系但又不是完全确定的关系,称为相关关系.回归分析就是研究相关关系的一种重要的数理统计方法.在回归分析中,当变量只有两个时,称为一元回归分析;当变量在两个以上时,称为多元回归分析.变量间成线性关系,称线性回归,变量间不具有线性关系,称非线性回归.第33页/共69页19:33342.线性回归分析的最小二乘法:yxo40003000200010002 4 6 8 10 从图看到,数据点大致落在一条直线附近,这告诉我们变量x和y之间大致可看作线性关系.从图中还看到,这些
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 计量 讲义
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内