第二章误差理论优秀课件.ppt
《第二章误差理论优秀课件.ppt》由会员分享,可在线阅读,更多相关《第二章误差理论优秀课件.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章误差理论第1页,本讲稿共34页第二章要点提示第二章要点提示 误差理论既是本课程的基础,又是本课程的难点,学习时误差理论既是本课程的基础,又是本课程的难点,学习时要注要注意正态分布(理论分布)的特点及其与上一章二项分布的联系;意正态分布(理论分布)的特点及其与上一章二项分布的联系;要注要注意样本统计量如意样本统计量如 、y、的概率分布类型(抽样分布)及的概率分布类型(抽样分布)及其参数与母总体概型及其参数的联系和区别(中心极限定理);其参数与母总体概型及其参数的联系和区别(中心极限定理);重点重点掌握误差和抽样误差在某些取值区间如左尾、右尾或两尾、中间概率的掌握误差和抽样误差在某些取值区间
2、如左尾、右尾或两尾、中间概率的计算方法。计算方法。涉及教材内容:第三章,第四章第三、四节。涉及教材内容:第三章,第四章第三、四节。作业布置:作业布置:教材教材第四章第四章P72 P72 P73 P73 T3、T4、T5、T6、T7、T8、T9、T10。第2页,本讲稿共34页第一节第一节 误差及其特征数误差及其特征数一、误差的概念一、误差的概念 总体指研究对象全体,即具有相同总体指研究对象全体,即具有相同性质和特征的个体(可供抽样观察的基性质和特征的个体(可供抽样观察的基本单位)所组成的集团。本单位)所组成的集团。总体拥有的个体数目叫总体容量总体拥有的个体数目叫总体容量(N),统计学中的个体与生
3、物个体不是,统计学中的个体与生物个体不是一个概念。一个概念。有时候总体有时候总体“由一切可能的观测结果由一切可能的观测结果组成组成”,此时的总体与个体只存在于特定,此时的总体与个体只存在于特定的时空,可以想象,但既的时空,可以想象,但既“看不见,又摸看不见,又摸不着不着”,如多次称量同一物体的质量。,如多次称量同一物体的质量。样本:随机从总体中抽出来用于研究样本:随机从总体中抽出来用于研究总体的那一部分个体(抽样单位)。总体的那一部分个体(抽样单位)。样本拥有的个体数叫样本容量样本拥有的个体数叫样本容量(n)。误差的本义是指随机变量的任意误差的本义是指随机变量的任意一个观察值与其真值的差异,即
4、一个观察值与其真值的差异,即Yi-。但统计学不是把误差当作常量来但统计学不是把误差当作常量来研究(因为实际工作中真值往往是未研究(因为实际工作中真值往往是未知数或无法计算其具体数值),而是知数或无法计算其具体数值),而是把它放在一定条件下作为随机变量来把它放在一定条件下作为随机变量来对待,即利用概率分布理论来描述误对待,即利用概率分布理论来描述误差在任一范围取值的可能性大小,所差在任一范围取值的可能性大小,所以误差实际被表述为以误差实际被表述为“y”。由于误差的取值已不再局限于间由于误差的取值已不再局限于间断性数据,其概率分布研究必须从连断性数据,其概率分布研究必须从连续性变量的实例作为出发点
5、。续性变量的实例作为出发点。第3页,本讲稿共34页第一节第一节 误差及其特征数误差及其特征数 例例2.1 研究一研究一10年生早熟无核蜜年生早熟无核蜜柑优良单株(芽变新株系)的果实大柑优良单株(芽变新株系)的果实大小,将所结小,将所结N=509个果实一个个地称个果实一个个地称重,再将得到的数据进行分组归类并重,再将得到的数据进行分组归类并统计各组次数如右图所示。统计各组次数如右图所示。利用次数分布表计算出反映果实利用次数分布表计算出反映果实平均大小和彼此悬殊程度(变异度)平均大小和彼此悬殊程度(变异度)的指标,即总体平均数的指标,即总体平均数=147g和总和总体标准差体标准差=17g,它们也是
6、,它们也是“单果重单果重”这一连续性变量的两个最重要的参这一连续性变量的两个最重要的参数,实际决定其概率分布的特征。数,实际决定其概率分布的特征。第4页,本讲稿共34页第一节第一节 误差及其特征数误差及其特征数讨论:讨论:如果说用公式(如果说用公式(=Yi/N)计算总体真)计算总体真值值 来反映果实大小的平均水平很自然的话,来反映果实大小的平均水平很自然的话,用用2=(y )2/N计算计算就显得非常特就显得非常特别,因为反映类似单果悬殊程度(简称变异别,因为反映类似单果悬殊程度(简称变异度,反过来讲就是整齐度)时也有人用所谓度,反过来讲就是整齐度)时也有人用所谓的的“平均误差平均误差”来表示过
7、,其算式(来表示过,其算式(|y|/N)虽然比计算标准差的公式还简单,但实)虽然比计算标准差的公式还简单,但实际研究中已不再有人用它,原因是总体标准际研究中已不再有人用它,原因是总体标准差不仅能从数值上显示差不仅能从数值上显示“变异度变异度”的大小,更的大小,更重要的它还是用作描述误差概率分布的尺度。重要的它还是用作描述误差概率分布的尺度。-51 -34 -17 0 17 34 51例例2.1:=147g=17g第5页,本讲稿共34页第一节第一节 误差及其特征数误差及其特征数二、关于二、关于“概率尺概率尺”该名词是误差理论应用于实际研究工该名词是误差理论应用于实际研究工作的需要而产生的,在我院
8、教改课题正作的需要而产生的,在我院教改课题正交表在试验统计中的新功用的完成过程交表在试验统计中的新功用的完成过程中提升为一个新的专业术语。中提升为一个新的专业术语。可这样定义:可这样定义:将误差或抽样误差转化为标准化随机将误差或抽样误差转化为标准化随机变量变量 u、t或或q、SSR 的尺度(分母)。的尺度(分母)。它是概率统计和试验研究的结合点,它是概率统计和试验研究的结合点,是随机变量最关键的变异特征数,可以是是随机变量最关键的变异特征数,可以是标准差或标准误,也可以是与之相近的统标准差或标准误,也可以是与之相近的统计量。试验统计中的核心问题就在于找到计量。试验统计中的核心问题就在于找到概率
9、尺的准确数值。概率尺的准确数值。(千分数)-51 -34 -17 0 17 34 51例例2.1:=147g=17g0.74680.09430.1689第6页,本讲稿共34页第二节第二节 数据整理数据整理*对样本(或总体)的全部观察值进行分组(归类)并统计各类次数的对样本(或总体)的全部观察值进行分组(归类)并统计各类次数的过程叫做数据整理,其结果通常都以次数分布表(或图)的形式体现出来。过程叫做数据整理,其结果通常都以次数分布表(或图)的形式体现出来。当样本(或总体)的观察值较多时,进行数据整理一方面可以更直观当样本(或总体)的观察值较多时,进行数据整理一方面可以更直观地描述变量取值的分布规
10、律,另一方面便于用加权法计算数据的特征数。地描述变量取值的分布规律,另一方面便于用加权法计算数据的特征数。数据的特征数包括(总体或样本)平均数和(总体或样本)标准差,数据的特征数包括(总体或样本)平均数和(总体或样本)标准差,还可以是标准误,标准差和标准误(平均数的标准差)都是反映数据变异还可以是标准误,标准差和标准误(平均数的标准差)都是反映数据变异性的数量指标,各自蕴藏着误差和抽样误差(如样本平均数和真值的差异)性的数量指标,各自蕴藏着误差和抽样误差(如样本平均数和真值的差异)变异幅度的信息,但它们决非(抽样)误差本身。变异幅度的信息,但它们决非(抽样)误差本身。间断性数据(含质量性状的指
11、标)大多可依据其性状自然归组。间断性数据(含质量性状的指标)大多可依据其性状自然归组。连续性数据则需要人为地进行分组,方法是先根据观察值(也称原始连续性数据则需要人为地进行分组,方法是先根据观察值(也称原始数据)的个数确定大致的组数,然后按数据的极差范围计算组距、调整组数据)的个数确定大致的组数,然后按数据的极差范围计算组距、调整组数,最后依最大的观察值和最小的观察值确定组限。数,最后依最大的观察值和最小的观察值确定组限。第7页,本讲稿共34页第第二二节节 数数据据整整理理 继继续续按按贝贝努努利利概概型型分分析析五五粒粒以以上上种种子子发发芽芽的的统统计计概概率率分分布布,绘绘成成条条形形图
12、图。可可以以看看出出,服服从从二二项项分分布布的的间间断断性性变变量量不不论论 p 是是否否等等于于 q,只只要要 n 足足够够大大,则则所所得得到到的的概概率率分分布布条条形形图图显显示示的的概概率率函函数数值值总总是是以以其其中中间间的的某某一一、两两项项为为最最大大,而而后后往往两两边边依依次次递递减减,当当 n 越越来来越越大大时时,概概率率分分布布图图也也是是愈愈趋趋对对称称,和和上上一一节节连连续续性性变变量量表表现现出出来来的的频频率率(或或次次数数)分分布布规规律律殊殊途途同同归归,呈呈现现出出两两头头低低、中中间间高高的的变变化化模模式式。这这正正说说明明间间断断性性变变量量
13、和和连连续续性性变变量量存存在在着着某某种种必必然然的的联联系系,正正态态分分布布本本身身及及其其发发现现和和重重新新发发现现的的过过程程就就是是这这种种联联系系的的最最好好证证明明。第8页,本讲稿共34页第二节第二节 数据整理数据整理第9页,本讲稿共34页第二节第二节 数据整理数据整理 例例2.2是由一个样本整理出的次数分布结是由一个样本整理出的次数分布结果,为反映果,为反映“行长行长4尺的水稻产量尺的水稻产量”这种和例这种和例2.1“单果重单果重”一样的连续性变量取值的分布一样的连续性变量取值的分布特征,将它绘制成频率分布(面积)图如右。特征,将它绘制成频率分布(面积)图如右。可以看出,该
14、图虽然是用面积表示频率,可以看出,该图虽然是用面积表示频率,但其特征显然是概率分布的反映。由于类似但其特征显然是概率分布的反映。由于类似这种通过样本间接描述变量概率分布特征的这种通过样本间接描述变量概率分布特征的大量事实都证明大量事实都证明“两头低,中间高两头低,中间高”的概率分的概率分布规律普遍存在,寻找这一分布的理论函数布规律普遍存在,寻找这一分布的理论函数也就成了正态分布作为第一个发现的理论分也就成了正态分布作为第一个发现的理论分布的契机。布的契机。(千分数)(千分数)例例2.2n=140 =158g S=36g第10页,本讲稿共34页第三节第三节 正态分布正态分布fN(y)N(,2)-
15、3 -2 -+2 +3-3 -2 -1 0 1 2 3y y-第11页,本讲稿共34页第三节第三节 正态分布正态分布一、正态分布的概率函数一、正态分布的概率函数二、正态分布概率函数曲线的特性二、正态分布概率函数曲线的特性 对称性:绝对值相等的正负误差出对称性:绝对值相等的正负误差出现的机会(概率)均等。现的机会(概率)均等。讨论:讨论:这里提到误差取某个这里提到误差取某个“值值”的概的概率问题,也就是连续性变量取某个观察值率问题,也就是连续性变量取某个观察值的概率究竟有没有意义?的概率究竟有没有意义?高等数学论及连续性变量取某一个实高等数学论及连续性变量取某一个实数的概率时,都认定是在概率函数
16、图中用数的概率时,都认定是在概率函数图中用某个点上的垂线求面积,无疑应该等于某个点上的垂线求面积,无疑应该等于“0”。但应用中获得的观察值不能简单地理但应用中获得的观察值不能简单地理解为解为“一个一个”实数,而应当视为在精度有限实数,而应当视为在精度有限的条件下,由最后一位有效数字按四舍五的条件下,由最后一位有效数字按四舍五入规则决定的虽然小却确实存在的区间。入规则决定的虽然小却确实存在的区间。N(0,2)fN(y-)-3-2 0 2 3 y-第12页,本讲稿共34页第三节第三节 正态分布正态分布 钟形:简称钟形:简称“两头低,中间高两头低,中间高”,即,即 fN(y)从)从+和和-两个远端朝
17、接近两个远端朝接近的方的方向递增(并在向递增(并在“拐点拐点”处曲线由处曲线由“凹凹”转转“凸凸”),),表明绝对值小的误差出现的表明绝对值小的误差出现的 概率大,绝对概率大,绝对值大的误差出现的值大的误差出现的 概率小。概率小。非负性:非负性:fN(y)0,即曲线总在,即曲线总在横坐标轴上方,两尾以横轴为渐进线,和横坐标轴上方,两尾以横轴为渐进线,和横轴围成的总面积就是横轴围成的总面积就是P()=1。特异性:随机变量的两个参数特异性:随机变量的两个参数和和分别决定分别决定fN(y)曲线的位置和形状,表)曲线的位置和形状,表明正态分布是一组曲线系统。明正态分布是一组曲线系统。N(,2)fN(y
18、-)-3-2 0 2 3 y-第13页,本讲稿共34页第三节第三节 正态分布正态分布0.50000.1586 -2 -+2 y -2 -0 2 y-(u)fN(y-)fN(y)-2 -1 0 1 2 u第14页,本讲稿共34页第三节第三节 正态分布正态分布0.68270.13590.02270.1586 fN(y)(=0 =1)N(0,1)(u)u第15页,本讲稿共34页第三节第三节 正态分布正态分布=0=1=2 标准差(标准差(=1)相同而平均数各不相相同而平均数各不相同的三种情形同的三种情形fN(y)y第16页,本讲稿共34页第三节 正态分布=1=1.5=2 平均数(平均数(=0)相同而标
19、准差各不相相同而标准差各不相同的三种情形同的三种情形fN(y)y第17页,本讲稿共34页第三节第三节 正态分布正态分布三、标准分布的累积函数三、标准分布的累积函数 例例2.3 假定假定 y N(,2),),=30,=5,试计算:,试计算:P(y26)、)、P(y40)、)、P(26y40)和)和 P(y40)。)。解:根据附表解:根据附表2查得的查得的(u)即标准分布曲线的左尾面积(概率)即标准分布曲线的左尾面积(概率)P(y26)=FN(26)=(2630)5=(-0.8)=0.2119P(y40)=FN(40)=(4030)5=(2.0)=0.9773 P(26y40)=FN(40)FN(
20、26)=0.7654 P(y40)=1 FN(40)=1 0.9773=0.0227 由此例可得到正确使用附表由此例可得到正确使用附表2的口诀:小于某数直接查,大于的口诀:小于某数直接查,大于某数某数 1 减它;区间概率大减小,两边临界一反查。减它;区间概率大减小,两边临界一反查。例例2.4 给定中间概率为给定中间概率为0.90或或0.95时,时,u 值应等于多少?值应等于多少?第18页,本讲稿共34页第三节第三节 正态分布正态分布26400.21190.76540.0227yfN(y)第19页,本讲稿共34页第三节 正态分布0.900.0250.0250.05 fN(y)(=0 =1)N(0
21、,1)(u)u第20页,本讲稿共34页第三节第三节 正态分布正态分布 到此为止,本章内容的讲授已顺着变量到此为止,本章内容的讲授已顺着变量连续性变量连续性变量误差的路径完成误差的路径完成了知识结构由概率论(正概率)了知识结构由概率论(正概率)统计学(逆概率)的转变,其内容也统计学(逆概率)的转变,其内容也由由“描述变量的概率分布描述变量的概率分布”“推断误差变量(任一区间)取值的概率推断误差变量(任一区间)取值的概率”。在学习下一节内容之前,请一定先记牢三个要点:在学习下一节内容之前,请一定先记牢三个要点:将第一章树立的研究随机变量的思想深化到研究连续性变量的层次,且不论用将第一章树立的研究随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 误差 理论 优秀 课件
限制150内