水文统计学习教案.pptx
会计学1水文水文(shuwn)统计统计第一页,共68页。第二节第二节概率概率(gil)的基本概念的基本概念三、频率三、频率水文事件不属古典概率水文事件不属古典概率(gil)事件,只能通过试验来估算概率事件,只能通过试验来估算概率(gil)。设事件在次试验中出现了次,则称。设事件在次试验中出现了次,则称为事件为事件A的频率。的频率。第2页/共68页第二页,共68页。第二节第二节概率概率(gil)的基本概念的基本概念掷币试验出现掷币试验出现(chxin)正面的频率表正面的频率表试验者试验者掷币次掷币次数数出现正出现正面次数面次数频率频率蒲丰蒲丰404020400.5080皮尔逊皮尔逊1200060180.5016皮尔逊皮尔逊24000120140.5006在试验次数足够大的情况在试验次数足够大的情况(qngkung)下,事件的频率和概率下,事件的频率和概率是十分接近的。是十分接近的。第3页/共68页第三页,共68页。第二节第二节概率概率(gil)的基本概念的基本概念()()()()()()()()式中,()事件与之和的概率;式中,()事件与之和的概率;()事件的概率;()事件的概率;()事件的概率。()事件的概率。()事件和共同()事件和共同(gngtng)发生的概率。发生的概率。四概率加法定理四概率加法定理(dngl)和乘法定理和乘法定理(dngl)概率加法定理概率加法定理第4页/共68页第四页,共68页。2、概率乘法定理 ()()()()()式中,()事件在事件已发生情况(qngkung)下 的概率,简称为的条件概率。()事件在事件已发生情况(qngkung)下 的概率,简称为的条件概率。对于两个独立事件:()()()第二节第二节概率概率(gil)的基本概念的基本概念第5页/共68页第五页,共68页。第三节第三节随机变量随机变量(sujbinlin)及其概率分布及其概率分布一、随机变量一、随机变量随机变量是表示随机变量是表示(biosh)随机试验结果的数随机试验结果的数量表示量表示(biosh),随机变量可分为两大类型:,随机变量可分为两大类型:离散型随机变量,连续型随机变量。离散型随机变量,连续型随机变量。第6页/共68页第六页,共68页。AB互斥互斥P(AB)0P(AB)P(A)P(B)AB相容相容P(AB)P(A)P(B/A)P(B)P(A/B)ABP(A)P(B)1P(A)1P(B)P(B)1P(A)对立对立AB独立独立(dl)P(AB)P(A)P(B)P(A/B)P(A)P(B/A)P(B)第7页/共68页第七页,共68页。例:某地区位于河流甲与乙的汇合点。当任一河流泛滥例:某地区位于河流甲与乙的汇合点。当任一河流泛滥(fnln)(fnln)时,该地区即被淹没,时,该地区即被淹没,设在某时期内河流甲泛的概率为设在某时期内河流甲泛的概率为0.10.1,河流乙泛滥,河流乙泛滥(fnln)(fnln)的概率为的概率为0.20.2;又知当河流甲;又知当河流甲泛滥泛滥(fnln)(fnln)时,河流乙泛滥时,河流乙泛滥(fnln)(fnln)的概率为的概率为0.30.3。求在该时期内这个地区被淹没的概。求在该时期内这个地区被淹没的概率。又当河流乙泛滥率。又当河流乙泛滥(fnln)(fnln)时河流甲泛滥时河流甲泛滥(fnln)(fnln)的概率?的概率?解:记河流的甲泛滥为事件,河流乙泛滥为事件。这个地区被淹没解:记河流的甲泛滥为事件,河流乙泛滥为事件。这个地区被淹没(ynm)(ynm)的概率的概率为:为:(AB)(A)(B)(AB)(A)(B)(BA)(A)0.10.20.30.10.27由于由于(yuy)(AB)()(B)()(BA)()(A)故当河流乙泛滥时,河流甲泛滥的概率为故当河流乙泛滥时,河流甲泛滥的概率为0.30.1/0.20.15(AB)(BA)(A)/(B)第8页/共68页第八页,共68页。二、随机变量的概率分布二、随机变量的概率分布随机变量的取值与其概率有一定的对应关系,称为随机变量的概率分布,数理统计学上记为随机变量的取值与其概率有一定的对应关系,称为随机变量的概率分布,数理统计学上记为F(x)P(Xx),称为随机变量的概率分布函数。),称为随机变量的概率分布函数。水文统计中通常水文统计中通常(tngchng)研究随机变量的取值大于某一个值的概率,研究随机变量的取值大于某一个值的概率,F(x)P(Xx)在水文统计学上也称此为随机变量的概率分布函数(或概率分布曲线)。)在水文统计学上也称此为随机变量的概率分布函数(或概率分布曲线)。第9页/共68页第九页,共68页。某雨量某雨量(yling)站的年雨量站的年雨量(yling)分布曲线分布曲线0.60.40.211001000900800700 x0.81.0P(Xx)第10页/共68页第十页,共68页。若若x800mm,由分布,由分布(fnb)曲线知曲线知P(X800)0.6,表明年雨量超过,表明年雨量超过800mm的概率等于的概率等于60。年雨量在年雨量在800mm900mm间的概率是多少呢?间的概率是多少呢?这就要讨论的随机变量落在某区间(这就要讨论的随机变量落在某区间(x,xx)内的概率,可用下式表示:)内的概率,可用下式表示:P(xxXx)F(x)F(xx)从图从图31得得:F(800)0.60;F(900)0.21故:故:P(900 x800)0.600.210.39年雨量落在年雨量落在800mm至至900mm之间的可能性是之间的可能性是39。第11页/共68页第十一页,共68页。函数函数f(x)-F(x)为概率密度)为概率密度(md)函数,简称为密度函数,简称为密度(md)函数或密度函数或密度(md)曲线。曲线。f(x)xf(x)dxdx概率密度函数概率密度函数第12页/共68页第十二页,共68页。f(x)x密度密度(md)函数函数F(xp)=P(Xxp)xp第13页/共68页第十三页,共68页。f(x)xxp概率分布函数与密度概率分布函数与密度(md)函数关系函数关系F(xp)=P(Xxp)F(x)F(xp)x第14页/共68页第十四页,共68页。三、随机变量的分布参数三、随机变量的分布参数(cnsh)概率分布曲线完整地刻划了随机变量的统计规律。但在一些实际问题中,有时只要知道概率分布某些特征数值。这种以简便的形式显示出随机变量分布规律的某些特征数字称为随机变量的分布参数概率分布曲线完整地刻划了随机变量的统计规律。但在一些实际问题中,有时只要知道概率分布某些特征数值。这种以简便的形式显示出随机变量分布规律的某些特征数字称为随机变量的分布参数(cnsh)。第15页/共68页第十五页,共68页。(一)位置特征参数(一)位置特征参数 平均数反映密度平均数反映密度(md)(md)分布的重心,计算公式分布的重心,计算公式 亦可写成数学亦可写成数学(shxu)期望期望连续型随机变量连续型随机变量(sujbinlin)的数学期望的数学期望第16页/共68页第十六页,共68页。(二)离散(二)离散(lsn)特征参数特征参数离散离散(lsn)特征参数是刻划随机变量分布离散特征参数是刻划随机变量分布离散(lsn)程度的指标。程度的指标。1标准差(均方差)标准差(均方差)分布愈分散分布愈分散(fnsn),标准差愈大;分布愈集中,标准差愈小。,标准差愈大;分布愈集中,标准差愈小。标准差的平方标准差的平方2称为方差。称为方差。第17页/共68页第十七页,共68页。标准差对频率曲线标准差对频率曲线(qxin)的影响的影响1212第18页/共68页第十八页,共68页。2 2离势系数(离差系数,变差系数)离势系数(离差系数,变差系数)例如例如:甲地区的年雨量分布,甲地区的年雨量分布,EX1EX11200mm1200mm,标准差,标准差11360mm360mm;乙地区;乙地区的年雨量分布,的年雨量分布,EX2EX2800mm800mm,标准差,标准差22320mm320mm。尽管。尽管1122,但是,但是 EX2 EX2 EX1 EX1,应从相对,应从相对(xingdu)(xingdu)观点来比较这两个分布的离散程度。观点来比较这两个分布的离散程度。采用一个无因次的数字来衡量分布的相对采用一个无因次的数字来衡量分布的相对(xingdu)(xingdu)离散程度,离散程度,称为离势系数称为离势系数算得两个地区年雨量的离势系数,算得两个地区年雨量的离势系数,CV10.30,CV20.40。说明说明(shumng)甲地区的年雨量离散程度较乙地区的为小。甲地区的年雨量离散程度较乙地区的为小。第19页/共68页第十九页,共68页。3偏态系数(偏差偏态系数(偏差(pinch)系数)系数)反映分布是否对称的特征反映分布是否对称的特征CS参数,记为参数,记为用来用来(ynli)表征分布不对称的情况。当密度曲线对表征分布不对称的情况。当密度曲线对EX对称,对称,CS0;若不对称,当正离差的立方占优时,;若不对称,当正离差的立方占优时,CS0,称为正偏;当负离差的立方占优势时,称为正偏;当负离差的立方占优势时,CS0,称为负偏。,称为负偏。第20页/共68页第二十页,共68页。Cs0Cs0Cs0Cs 对密度对密度(md)曲线的影响曲线的影响第21页/共68页第二十一页,共68页。四、几种常用的概率分布曲线四、几种常用的概率分布曲线(qxin)(一)正态分布(一)正态分布概率密度函数形式:概率密度函数形式:式中,式中,平均数平均数标准差标准差正态分布在误差正态分布在误差(wch)估算时将会应用。估算时将会应用。第22页/共68页第二十二页,共68页。正态分布曲线正态分布曲线(qxin)f(x)68.3%第23页/共68页第二十三页,共68页。(二)皮尔逊(二)皮尔逊型分布型分布皮尔逊皮尔逊III型曲线为一端型曲线为一端(ydun)有限一端有限一端(ydun)无限的不对称单峰曲线,概率密度函数无限的不对称单峰曲线,概率密度函数式中,式中,a0参数参数(cnsh),且有:,且有:第24页/共68页第二十四页,共68页。如果已知设计如果已知设计(shj)值值xP,推求,推求xp 取决于取决于p、和和O四个数,并且当四个数,并且当、O 三个参数为已知时,则三个参数为已知时,则xp只取决于只取决于p了。了。、O与分布曲线的与分布曲线的EX,CV和和CS有关有关(yugun),因此只要确定,因此只要确定EX、CV和和CS,xp仅与仅与p有关有关(yugun),可以由,可以由p唯一地来计算唯一地来计算xp。第25页/共68页第二十五页,共68页。P3型分布的积分无解析解,实用型分布的积分无解析解,实用(shyng)中制表查用。中制表查用。取标准化变量取标准化变量(binling)(离均系数)(离均系数)将之代入式(将之代入式(322)得)得被积函数只含一个参数被积函数只含一个参数CS。只要给定。只要给定(idn)CS就可以算出就可以算出P和和P的对应值,最终制定出的对应值,最终制定出PCsp的对应数值表(表的对应数值表(表32)。)。第26页/共68页第二十六页,共68页。由给定的由给定的CSCS及及p p从表从表3232查出查出PP,通过,通过xP xP(P CVP CV1 1)EX EX 即可决定出即可决定出xPxP。因此,。因此,已知已知EXEX,CVCV,CSCS就可求出与各种就可求出与各种p p值相应的值相应的xPxP值,也就可以绘制分布曲线或频率曲线。值,也就可以绘制分布曲线或频率曲线。例如例如(lr)(lr),已知某地年平均雨量,已知某地年平均雨量EXEX1000mm1000mm、CVCV0.50.5、CSCS1.01.0,求,求p p1%1%的设的设计年雨量。计年雨量。由由C CS S1.01.0,p p1%1%查得查得 P P3.023.02,X X1%1%=(P P CvCv1 1)EX EX (3.020.53.020.51 1)1000 1000 25102510(mmmm)第27页/共68页第二十七页,共68页。第四节第四节第四节第四节 统计参数统计参数统计参数统计参数(cnsh)(cnsh)估算估算估算估算 在概率分布函数中包含有在概率分布函数中包含有 ,CVCV,CS CS 三个参数。为了唯三个参数。为了唯一确定概率分布函数,就得估算这些参数。一确定概率分布函数,就得估算这些参数。一、样本估计总体一、样本估计总体 水文变量的总体是指自古迄今以至未来水文变量的总体是指自古迄今以至未来(wili)(wili)长远长远岁月所有的水文系列,是不知道的,需要靠观测到的岁月所有的水文系列,是不知道的,需要靠观测到的样本去估计总体参数。现有的水文观测的系列可以当样本去估计总体参数。现有的水文观测的系列可以当作总体的一个随机样本来处理。作总体的一个随机样本来处理。第28页/共68页第二十八页,共68页。某地某地(mud)降雨量频率计算表降雨量频率计算表第29页/共68页第二十九页,共68页。由表由表34资料可绘出如图资料可绘出如图39所示的折线图,该图表示年降水量所示的折线图,该图表示年降水量P(Xx)的频率)的频率(pnl)W(Xx)和)和x的关系的关系某地年降雨量经验分布某地年降雨量经验分布(fnb)曲线曲线020406080100W(%)p p 1200 1200 1000 1000 800800第30页/共68页第三十页,共68页。随着样本容量的增加(即随着观测次数的增加),频率随着样本容量的增加(即随着观测次数的增加),频率w w就非常接近于概率就非常接近于概率p p,经验分布曲线就非常接近于总体分布曲线。在某种程度上由样本的经验分布来推测总体分布,总体的参数就可以通过抽出的样本(观测的系列,经验分布曲线就非常接近于总体分布曲线。在某种程度上由样本的经验分布来推测总体分布,总体的参数就可以通过抽出的样本(观测的系列(xli)(xli))来加以估算了。)来加以估算了。第31页/共68页第三十一页,共68页。(1)样本的均值)样本的均值X,它与总体均值相对应,即,它与总体均值相对应,即(2)样本标准差)样本标准差S与总体标准差与总体标准差相对应,即相对应,即(3)样本离势系数)样本离势系数CV与总体离势系数相对应,即与总体离势系数相对应,即(4)样本偏态系数)样本偏态系数CS,与总体参数,与总体参数(cnsh)偏态系数相对应,即偏态系数相对应,即只要掌握了样本,借助上列公式估计出参数只要掌握了样本,借助上列公式估计出参数(cnsh);就可推出概率分布曲线,这种方法叫做矩法。;就可推出概率分布曲线,这种方法叫做矩法。第32页/共68页第三十二页,共68页。原矩法公式得出的原矩法公式得出的SS,CV CV,和,和CS CS 并不是无偏估计量,目前水文上采用并不是无偏估计量,目前水文上采用(ciyng)(ciyng)的是经修正后的矩法公式的是经修正后的矩法公式:第33页/共68页第三十三页,共68页。第五节第五节 配线法估计配线法估计(gj)(gj)水文分布参数水文分布参数 某地某地(mud)年降雨量经验分布曲线年降雨量经验分布曲线020406080100W(%)x 1200 1000 800一、经验频率一、经验频率(pnl)曲线曲线W(Xxi)i/n第34页/共68页第三十四页,共68页。二、经验二、经验(jngyn)频率频率 如果用如果用W W(XxiXxi)i/ni/n的经验分布曲线的经验分布曲线(qxin)(qxin)估计总体分布曲线估计总体分布曲线(qxin)(qxin),存在不合理现象。当,存在不合理现象。当m mn n时,最末项的频率为时,最末项的频率为100%100%,样本末项值为总体中的最小值,不符合事实,因为比样本最小值更小的数值今后仍可能出现。,样本末项值为总体中的最小值,不符合事实,因为比样本最小值更小的数值今后仍可能出现。水文上用水文上用(shn yn)(shn yn)期望值公式估计频率。期望值公式估计频率。第35页/共68页第三十五页,共68页。频率这个频率这个(zh ge)(zh ge)词比较抽象,为便于理解,有时采用重现期这个词比较抽象,为便于理解,有时采用重现期这个(zh ge)(zh ge)词。所谓重现期是指在许多试验中,某一事件重复出现的时间间隔的平均数。词。所谓重现期是指在许多试验中,某一事件重复出现的时间间隔的平均数。在工程水文中,重现期用字母在工程水文中,重现期用字母 T T 表示,一般以年为单位。表示,一般以年为单位。第36页/共68页第三十六页,共68页。当研究当研究(ynji)暴雨洪水问题时暴雨洪水问题时例如,当暴雨例如,当暴雨(boy)或洪水的频率采用或洪水的频率采用p1%时,时,T100年,称此暴雨年,称此暴雨(boy)为百年一遇的暴雨为百年一遇的暴雨(boy)或洪水。或洪水。当研究当研究(ynji)枯水问题时枯水问题时例如,对于例如,对于p80%枯水流量,枯水流量,T5年,称此为五年一遇的枯水流量。或称为保证率为年,称此为五年一遇的枯水流量。或称为保证率为80的设计流量。的设计流量。T=1/PT=1/1-P第37页/共68页第三十七页,共68页。所谓所谓(suwi)(suwi)百年一遇的暴雨或洪水,百年一遇的暴雨或洪水,是指大于或等于这样的暴雨或洪水在长时是指大于或等于这样的暴雨或洪水在长时期内平均期内平均100100年发生一次,而不能认为每隔年发生一次,而不能认为每隔100100年必然遇上一次。年必然遇上一次。第38页/共68页第三十八页,共68页。三、配线法三、配线法 根据经验频率分布点据,找出与之配合最佳的频率曲线,其相应的分布参数,作为根据经验频率分布点据,找出与之配合最佳的频率曲线,其相应的分布参数,作为(zuwi)(zuwi)总体分布参数的估计值。总体分布参数的估计值。第39页/共68页第三十九页,共68页。计算计算(jsun)步骤:步骤:(1)点绘经验)点绘经验(jngyn)点据点据纵坐标为变量值,横坐标为经验纵坐标为变量值,横坐标为经验(jngyn)频率,采用期望值公式估计。频率,采用期望值公式估计。(2)初定一组参数)初定一组参数用矩法公式的估算用矩法公式的估算EX和和CV,并假定,并假定(jidng)CS与与CV的比值的比值K估算估算CS。(3)根据初定的)根据初定的EX、CV和和CS,计算频率曲线,并绘在点有经验点据的图上。若与经验点据配合不理想,则修改参数再次配线,主要调整,计算频率曲线,并绘在点有经验点据的图上。若与经验点据配合不理想,则修改参数再次配线,主要调整CV以及以及CS。(4)选择一条与经验点据配合最佳曲线作为采用曲线。该曲线的参数看作总体参数的估计值。)选择一条与经验点据配合最佳曲线作为采用曲线。该曲线的参数看作总体参数的估计值。第40页/共68页第四十页,共68页。为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。由频率曲线图可明显看出,由频率曲线图可明显看出,CV值愈大,曲线愈陡;当值愈大,曲线愈陡;当CS增大时,曲线上段变陡而下段趋于平缓。增大时,曲线上段变陡而下段趋于平缓。配线法采用配线法采用(ciyng)了概率格纸,以正态分布曲线成直线来划分概率坐标的。当了概率格纸,以正态分布曲线成直线来划分概率坐标的。当CS0,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。第41页/共68页第四十一页,共68页。37某站年降水量频率某站年降水量频率(pnl)计算表计算表某站共有实测降水量资料某站共有实测降水量资料(zlio)24年,求频率为年,求频率为10%和和90%的年降水量。的年降水量。(1)将原始资按大小)将原始资按大小(dxio)次序排列,列入表(次序排列,列入表(4)栏。)栏。(2)按期望值公式计算经验频率,列入表()按期望值公式计算经验频率,列入表(5)栏。并将)栏。并将X与与P对应点绘于概率格纸上。对应点绘于概率格纸上。第42页/共68页第四十二页,共68页。(3)用矩法计算系列的多年平均)用矩法计算系列的多年平均(pngjn)降水量和离差系数。降水量和离差系数。第43页/共68页第四十三页,共68页。(4)选定)选定CV0.30,并假定,并假定(jidng)CS2CV0.60查表查表3-2得得P,求得,求得xP(PCV1),如表(),如表(3)栏。根据表中()栏。根据表中(1)、()、(3)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。(5)改变参数,重新配线。因为曲线)改变参数,重新配线。因为曲线(qxin)头尾部偏低,故需增大头尾部偏低,故需增大CS,CV0.30不变,不变,CS3CV0.90,查算出各,查算出各xP值,列入表(值,列入表(4)、()、(5)栏,点绘后曲线)栏,点绘后曲线(qxin)的头部和尾部反而有些偏离,配线仍不理想。的头部和尾部反而有些偏离,配线仍不理想。第44页/共68页第四十四页,共68页。(6)再次改变参数)再次改变参数(cnsh),第三次配线。把,第三次配线。把CS稍微调小一些。选定稍微调小一些。选定CV0.30,CS2.5CV0.75,查表计算出各,查表计算出各xP值,列入表(值,列入表(6)、()、(7)栏中。绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。)栏中。绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。(7)求得)求得p10%的年降水量为的年降水量为933mm,p90%的年降水量为的年降水量为433mm。第45页/共68页第四十五页,共68页。表表-8频率曲线选配频率曲线选配(xunpi)计算表计算表第46页/共68页第四十六页,共68页。第47页/共68页第四十七页,共68页。配线法得到的成果仍具有抽样误差配线法得到的成果仍具有抽样误差,而这而这种误差目前还难以精确估算种误差目前还难以精确估算,因此对于工程上因此对于工程上最终采用的频率曲线及相应的统计参数最终采用的频率曲线及相应的统计参数(cnsh),(cnsh),不仅要从水文统计方面分析不仅要从水文统计方面分析,而且而且还要密切结合水文现象的物理成因及地区规还要密切结合水文现象的物理成因及地区规律进行综合分析律进行综合分析.第48页/共68页第四十八页,共68页。一、相关关系的概念 1相关的意义与应用 按数理统计法建立上述两个或多个随机变量之间的联系,称之为相关关系。把对这种关系的分析和建立称为相关分析。水文上用相关分析可以延长(ynchng)和插补短系列,使水文资料满足代表性要求。第六节第六节 相关相关(xinggun)(xinggun)分析分析第49页/共68页第四十九页,共68页。2相关的分类相关的分类完全相关(函数关系)完全相关(函数关系)零相关(没有零相关(没有(miyu)关系)关系)相关关系(统计关系)相关关系(统计关系)第50页/共68页第五十页,共68页。3相关分析的内容 (1)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切(mqi)程度;(2)确定变量间的数量关系回归方程或相关线;(3)根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析。第51页/共68页第五十一页,共68页。二、直线二、直线(zhxin)相关相关 1 1相关图解法相关图解法 设设xi xi 和和yi yi 代表两系列的观测值,共有代表两系列的观测值,共有n n 对,把对应值点绘于对,把对应值点绘于方格纸上,如果相关点的平均趋势近似直线方格纸上,如果相关点的平均趋势近似直线(zhxin)(zhxin),即可通过,即可通过点群中间及(点群中间及(,)点绘出相关直线)点绘出相关直线(zhxin),(zhxin),说明变量说明变量x x与与y y为为线性相关线性相关,满足方程:满足方程:y y a a bx bx第52页/共68页第五十二页,共68页。某流域年降雨某流域年降雨某流域年降雨某流域年降雨(jin y)(jin y)(jin y)(jin y)径流资料径流资料径流资料径流资料 年份年份年雨量年雨量X年径流年径流Y19542014136219551211728195617281369195711576951958125772019591029534196013067781961102933719621316809196313569291964126679619651052383第53页/共68页第五十三页,共68页。第54页/共68页第五十四页,共68页。2 2相关计算法相关计算法 为避免为避免(bmi(bmi n)n)相关图解法在定线上的任意性,常采用相关计算相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。直线相关方程的形式为法来确定相关线的方程,即回归方程。直线相关方程的形式为:y=a+bx y=a+bx 式中式中 x x 自变量;自变量;y y 倚变量;倚变量;a a、b b 待定常数。待定常数。第55页/共68页第五十五页,共68页。待定常数待定常数a a、b b 由观测点与直线拟合由观测点与直线拟合(n h)(n h)最佳,通过最最佳,通过最小二乘法进行估计。最后得到如下形式的回归方程:小二乘法进行估计。最后得到如下形式的回归方程:式中式中 、x x、y y 系列的均方差;系列的均方差;、x x、y y 系列的均值;系列的均值;r r 相关系数,表示相关系数,表示x x、y y 两系列间的密切两系列间的密切(mqi)(mqi)程度。程度。第56页/共68页第五十六页,共68页。相关系数相关系数相关系数相关系数第57页/共68页第五十七页,共68页。若以y 求x,则要应用(yngyng)x 倚y 的回归方程。x 倚y 的回归方程为:一般y倚x与x倚y的两回归线并不重合,但有一个公共交点()。第58页/共68页第五十八页,共68页。某流域某流域某流域某流域(liy)(liy)(liy)(liy)年降雨径流资年降雨径流资年降雨径流资年降雨径流资料料料料年份年份年雨量年雨量X年径流年径流Y19542014136219551211728195617281369195711576951958125772019591029534196013067781961102933719621316809196313569291964126679619651052383第59页/共68页第五十九页,共68页。第60页/共68页第六十页,共68页。3相关分析的误差-回归线的误差回归线仅是观测点据的最佳配合线,通常观测点据并不完全落在回归线上,而是散布于回归线的两旁。因此,回归线只反映两变量间的平均关系。按此关系推求(tuqi)的值和实际值之间存在着误差,误差大小一般采用均方误来表示。第61页/共68页第六十一页,共68页。如用如用Sy Sy 表示表示y y 倚倚x x 回归线的均方误,回归线的均方误,yi yi 为观测为观测(gunc)(gunc)值,值,为回归线上的对应值,为回归线上的对应值,n n 为系列项数,则为系列项数,则 同样,同样,x x 倚倚y y 回归线的均方误回归线的均方误Sx Sx 为为 第62页/共68页第六十二页,共68页。-相关系数误差相关系数误差 在相关分析在相关分析(fnx)(fnx)中,相关系数是根据有限的实测资料计算出来的,必然会有抽样误差。一般通过相关系数的均方误中,相关系数是根据有限的实测资料计算出来的,必然会有抽样误差。一般通过相关系数的均方误(或随机误差或随机误差)来判断样本相关系数的可靠性。来判断样本相关系数的可靠性。Er=0.6745r第63页/共68页第六十三页,共68页。-相关相关(xinggun)(xinggun)系数的统计检验系数的统计检验 总体不相关总体不相关(xinggun)(xinggun)(r=0r=0)的两变量,由于抽样原)的两变量,由于抽样原因,样本的相关因,样本的相关(xinggun)(xinggun)系数不一定等于零。为此,需系数不一定等于零。为此,需要对相关要对相关(xinggun)(xinggun)系数进行显著性检验。系数进行显著性检验。检验方法是:先选一个临界相关检验方法是:先选一个临界相关(xinggun)(xinggun)系数系数rr,与,与样本的相关样本的相关(xinggun)(xinggun)系数系数r r相比较,若相比较,若r rrr,则具有相,则具有相关关(xinggun)(xinggun)关系;否则,无相关关系;否则,无相关(xinggun)(xinggun)关系。关系。rr可可以根据样本项数以根据样本项数n n和信度和信度(一般采用(一般采用=0=0 0505)从已制成)从已制成的相关的相关(xinggun)(xinggun)系数检验表中查取。系数检验表中查取。第64页/共68页第六十四页,共68页。三、曲线三、曲线(qxin)相关相关 许多(xdu)水文现象间的关系,并不表现为直线关系而具有曲线相关的形式。水文上常采用幂函数、指数函数两种曲线,基本作法是将其转换为直线,再进行直线回归分析。第65页/共68页第六十五页,共68页。1 1幂函数幂函数 幂函数的一般形式为幂函数的一般形式为 y=axb y=axb 两边取对数两边取对数logy=loga+blogxlogy=loga+blogx 令令 Y=logy,A=loga,X=logx Y=logy,A=loga,X=logx 则有则有 Y=A+b X Y=A+b X 对对X X和和Y Y而言就是而言就是(jish)(jish)直线关系,可对其作直线直线关系,可对其作直线回归分析。回归分析。第66页/共68页第六十六页,共68页。2指数函数 指数函数的一般形式为 y=A ebx 两边取对数 logy=loga+bxloge 令 Y=logy,A=loga,B=bloge,X=x 则有 Y=A+B X 这样对X和Y同样也可作直线(zhxin)相关分析。第67页/共68页第六十七页,共68页。感谢您的观看感谢您的观看(gunkn)!第68页/共68页第六十八页,共68页。