《海洋调查方法课时精选文档.ppt》由会员分享,可在线阅读,更多相关《海洋调查方法课时精选文档.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、海洋调查方法课时本讲稿第一页,共三十二页16.1 数据误差的几种定义数据误差的几种定义n测定值与真值之间的差异,称为测定值的观测误差,简称误差。测定值与真值之间的差异,称为测定值的观测误差,简称误差。n绝对误差绝对误差n误差为正,测量值偏大,称误差为正,测量值偏大,称“强近似强近似”,负号代表,负号代表“弱近似弱近似”数值为偏离大小数值为偏离大小n若取若取 的最大值,则称为最大绝对误差,可以认为所有的最大值,则称为最大绝对误差,可以认为所有观测值都在观测值都在 之内,或者说真值之内,或者说真值T在测定值在测定值 的范的范围之内,从而在绝对数量上说明了测定值准确程度。围之内,从而在绝对数量上说明
2、了测定值准确程度。本讲稿第二页,共三十二页相对误差相对误差在某些场合,只有用误差和测定值的相对大小才能更好地在某些场合,只有用误差和测定值的相对大小才能更好地表示测量的准确程度,引进了相对误差的概念。表示测量的准确程度,引进了相对误差的概念。绝对误差和真实值的比值,叫做相对误差,用绝对误差和真实值的比值,叫做相对误差,用 表示表示本讲稿第三页,共三十二页n残差:观测值与算术平均值之差残差:观测值与算术平均值之差n平均误差平均误差为了了解多次观测中误差的平均水平,从而评价观测的精度为了了解多次观测中误差的平均水平,从而评价观测的精度,就把所有误差先取绝对值,然后总和平均,不管误差的正,就把所有误
3、差先取绝对值,然后总和平均,不管误差的正负,只要数值一样,对平均误差这个统计量的贡献相同,由负,只要数值一样,对平均误差这个统计量的贡献相同,由此得到算术平均误差此得到算术平均误差a,也叫均偏:,也叫均偏:n或然误差(又称中值误差或概差)或然误差(又称中值误差或概差)定义为:比这个数值小的误差出现的概率,与比这个数值大定义为:比这个数值小的误差出现的概率,与比这个数值大的观测误差出现的概率恰好相等,各占一半,用的观测误差出现的概率恰好相等,各占一半,用 表示。表示。本讲稿第四页,共三十二页均方误差(又称标准误差)均方误差(又称标准误差)目的:对大误差出现的可能性做足够的估计。平均误差中,目的:
4、对大误差出现的可能性做足够的估计。平均误差中,使为数极少的大误差在平均过程中被为数众多的小误差所淹使为数极少的大误差在平均过程中被为数众多的小误差所淹没,不能够清楚的反映大误差特征。没,不能够清楚的反映大误差特征。定义:对各个误差的平方和取平均,再对其结果开平方。若定义:对各个误差的平方和取平均,再对其结果开平方。若 为各个观测值的误差,则:为各个观测值的误差,则:本讲稿第五页,共三十二页考虑到观测误差的所谓考虑到观测误差的所谓“自由度自由度”:只有一个观测值是无法计:只有一个观测值是无法计算误差的,二个观测值可以计算误差,但这二个误差是相互算误差的,二个观测值可以计算误差,但这二个误差是相互
5、约束的,而只有一个是自由的,故严格来讲,应该是:约束的,而只有一个是自由的,故严格来讲,应该是:观测较多时,观测较多时,n与与n-1在计算时差别不大,可用在计算时差别不大,可用n代替,观测代替,观测较少时,要用较少时,要用n-1。可以证明,它就是误差正态分布函数中。可以证明,它就是误差正态分布函数中的的本讲稿第六页,共三十二页X=5:0.1:6n样本数11:均方差为0.3162n样本数10:均方差为0.3317X=3次Xn样本数33:均方差为0.3162n样本数32:均方差为0.3211X=9次Xn样本数99:均方差为0.3162n样本数98:均方差为0.3178本讲稿第七页,共三十二页根据误
6、差正态分布函数,可以计算出绝对值大于均根据误差正态分布函数,可以计算出绝对值大于均方误差的误差,其出现的概率约为方误差的误差,其出现的概率约为32%,即有,即有68%的观测值在均方误差的数值范围之内的观测值在均方误差的数值范围之内比均方误差大二倍以上的误差出现的概率为比均方误差大二倍以上的误差出现的概率为3.5%,大于三倍的均方误差的误差概率只有大于三倍的均方误差的误差概率只有0.3%或然误差或然误差本讲稿第八页,共三十二页离差系数n两个均值相同的系列,可以用均方差大小来测定它们的离散程两个均值相同的系列,可以用均方差大小来测定它们的离散程度,但在均值不等时,则不行。度,但在均值不等时,则不行
7、。n均方差受平均值的约束,一般而言,均值大的系列,均方差均方差受平均值的约束,一般而言,均值大的系列,均方差要大一些,因此均方差相等,不能说明两系列的离散程度一要大一些,因此均方差相等,不能说明两系列的离散程度一样。样。n为消除均值的影响,用均方差与均值的比值来表征,称为离差系数:为消除均值的影响,用均方差与均值的比值来表征,称为离差系数:本讲稿第九页,共三十二页偏差系数偏差系数n系列的离散程度可以通过均方差和离差系数来了解,可是对于系系列的离散程度可以通过均方差和离差系数来了解,可是对于系列的偏度,即是对称分布还是非对称分布仍不知道,需要用另外列的偏度,即是对称分布还是非对称分布仍不知道,需
8、要用另外的度量来测定它。的度量来测定它。n一个数列按大小次序排列后,如果相对平均值的两边对称位置上的一个数列按大小次序排列后,如果相对平均值的两边对称位置上的各变数都相等,此时称这个系列为对称分布,否则为偏态分布。偏各变数都相等,此时称这个系列为对称分布,否则为偏态分布。偏度:度:本讲稿第十页,共三十二页n对称分布时,均差立方有正负号,正负号立方正好对称分布时,均差立方有正负号,正负号立方正好抵消,即偏度抵消,即偏度=0n偏态分布时,偏度偏态分布时,偏度0,正值占优势,称为正偏,偏度,正值占优势,称为正偏,偏度0,负值占优势,称为负偏。,负值占优势,称为负偏。n同均方差要化成离散系数一样,偏度
9、也要消除均方同均方差要化成离散系数一样,偏度也要消除均方差所引起的影响,定义为偏差系数:差所引起的影响,定义为偏差系数:本讲稿第十一页,共三十二页16.2 函数误差的传播函数误差的传播1、函数误差合成、函数误差合成间接测量的量间接测量的量y的系统误差的系统误差 y等于直接测量的各分量的已定等于直接测量的各分量的已定系统误差与相应的偏导数的乘积之代数和系统误差与相应的偏导数的乘积之代数和假定因变量假定因变量y与多个自变量与多个自变量x1,x2,xn存在函数关系:存在函数关系:例如:密度或声速例如:密度或声速=f(温度、盐度、压力温度、盐度、压力)等等本讲稿第十二页,共三十二页对函数对函数 进行偏
10、微分进行偏微分注意:这是指一次观测的偏差值,而不是经过处理后的注意:这是指一次观测的偏差值,而不是经过处理后的误差统计量误差统计量本讲稿第十三页,共三十二页2、函数均方误差、函数均方误差x1,x2,xn是能够独立观测的量,对应有各自的均方是能够独立观测的量,对应有各自的均方误差误差s1,s2,sn,y要由要由n个自变量的测定值来计算,个自变量的测定值来计算,那么,所计算的函数值那么,所计算的函数值y的均方误差有多大?的均方误差有多大?本讲稿第十四页,共三十二页对所有观测结果求和:对所有观测结果求和:本讲稿第十五页,共三十二页16.3 误差的产生和消除误差的产生和消除1、误差的产生、误差的产生n
11、系统误差系统误差由于测量仪器不准确、测量方法不合理、测定技术不完善、测由于测量仪器不准确、测量方法不合理、测定技术不完善、测量条件量条件(如温度、湿度、压力等如温度、湿度、压力等)的非随机变化、不同测量者的的非随机变化、不同测量者的习惯等引起的观测误差,这种误差与观测系统本身有关,可以习惯等引起的观测误差,这种误差与观测系统本身有关,可以分为恒定误差和非恒定误差两种分为恒定误差和非恒定误差两种恒定误差:总是偏大或偏小,偏离的数值和符号也大体相同,又称为常差恒定误差:总是偏大或偏小,偏离的数值和符号也大体相同,又称为常差,一般由仪器本身造成,一般由仪器本身造成非恒定误差:偶然原因,或仪器磨损、老
12、化等,可以通过统计方法来检验非恒定误差:偶然原因,或仪器磨损、老化等,可以通过统计方法来检验本讲稿第十六页,共三十二页n过失误差过失误差观测者在操作、读数或计算过程中引起的误差,也叫不正当观测者在操作、读数或计算过程中引起的误差,也叫不正当误差误差n偶然误差偶然误差又称实验误差或随机误差,除了系统误差和过失误差之外的又称实验误差或随机误差,除了系统误差和过失误差之外的一切误差一切误差特点:反复测量一个量时,这种误差表现出大小及符号各不特点:反复测量一个量时,这种误差表现出大小及符号各不相同,不能人为的加以控制,可以看出完全是由于偶然的原相同,不能人为的加以控制,可以看出完全是由于偶然的原因无意
13、识的引入进来的,因无意识的引入进来的,随着测量次数的增加,偶然误差的随着测量次数的增加,偶然误差的算术平均值趋向于零服从正态概率分布规律算术平均值趋向于零服从正态概率分布规律本讲稿第十七页,共三十二页2、误差的消除、误差的消除n提高信噪比提高信噪比比如潮汐观测数据序列中,与天体运动有关的部分就是天文比如潮汐观测数据序列中,与天体运动有关的部分就是天文潮的信息,由于风、气压、降雨等引起的水位变动及仪器和潮的信息,由于风、气压、降雨等引起的水位变动及仪器和观测者引起的误差等属于噪音,信息部分与噪音部分的比值观测者引起的误差等属于噪音,信息部分与噪音部分的比值,称为信噪比,称为信噪比手段:手段:增加
14、仪器观测精度和缩短观测时间间隔增加仪器观测精度和缩短观测时间间隔改善观测条件改善观测条件本讲稿第十八页,共三十二页n 用数字滤波方法来过滤无规则的噪音用数字滤波方法来过滤无规则的噪音n算术平均值对误差的消除算术平均值对误差的消除本讲稿第十九页,共三十二页n加权算术平均加权算术平均n加权算术平均的均方差加权算术平均的均方差本讲稿第二十页,共三十二页3、精密度和准确度、精密度和准确度n精密度精密度 简称精度或重复性,简称精度或重复性,指观测值出现的密集指观测值出现的密集程度程度本讲稿第二十一页,共三十二页n准确度准确度准确度是指观测值的算术平均值与真值的符合程度准确度是指观测值的算术平均值与真值的
15、符合程度精密度的高低决定于偶然误差的大小,而与系统误差无关,精密度的高低决定于偶然误差的大小,而与系统误差无关,准确度的高低既决定于系统误差的大小,也与偶然误差有关准确度的高低既决定于系统误差的大小,也与偶然误差有关本讲稿第二十二页,共三十二页本讲稿第二十三页,共三十二页置信度置信度P:在某一:在某一t值时,测定值落在(值时,测定值落在(ts)范围范围内的概率。落在此范围之外的概率为(内的概率。落在此范围之外的概率为(1-P),称为,称为显著性水准显著性水准。ta,f:t值与置信度值与置信度P及自由度及自由度f关系。关系。t005,10表示置信度为表示置信度为95%,自由度为,自由度为10时的
16、时的t 值值 t001,5表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值值本讲稿第二十四页,共三十二页显著性检验显著性检验t检验法检验法步骤:步骤:a.将将 ,和和 n代入代入 ,求,求 t计计b.由已知的由已知的 f 和和 P 值查值查 t表表c.比较:如比较:如 t计计t表表,说明有显著性差异,存在,说明有显著性差异,存在系统误差。反之则无。系统误差。反之则无。本讲稿第二十五页,共三十二页16.4 偶然误差的正态分布偶然误差的正态分布频数分布:测定某样品频数分布:测定某样品100次,因有偶然次,因有偶然误差存在,故分析结果有高有低,有两误差存在,故分析结果有高有低,有两头
17、小、中间大的变化趋势,即在平均值头小、中间大的变化趋势,即在平均值附近的数据出现机会最多附近的数据出现机会最多。本讲稿第二十六页,共三十二页 相对频数分布直方图相对频数分布直方图频数分布表频数分布表本讲稿第二十七页,共三十二页正态分布正态分布n测测量量数数据据一一般般符符合合正正态态分分布布规规律律,即即高高斯斯分分布布,正正态态分分布布曲曲线线数学表达式为:数学表达式为:n y:概率密度;:概率密度;x:测量值:测量值n:总总体体平平均均值值,即即无无限限次次测测定定数数据据的的平平均均值值,无无系系统统误误差差时时即即为为真值;反映测量值分布的集中趋势。真值;反映测量值分布的集中趋势。n:总体标准偏差,反映测量值分布的分散程度;:总体标准偏差,反映测量值分布的分散程度;nx-:随机误差:随机误差本讲稿第二十八页,共三十二页概概 率率n 正态分布曲线:以正态分布曲线:以x-为横坐标建立的曲线。曲为横坐标建立的曲线。曲线与横坐标线与横坐标-到到+之间所夹的面积,代表所有数之间所夹的面积,代表所有数据出现概率的总和,其值应为据出现概率的总和,其值应为1,即概率,即概率P为:为:n设:设:本讲稿第二十九页,共三十二页本讲稿第三十页,共三十二页正态分布概率积分表正态分布概率积分表本讲稿第三十一页,共三十二页本讲稿第三十二页,共三十二页
限制150内