第三章_数字特征2.ppt
三、协方差三、协方差 对对于于二二维维随随机机向向量量(X X,Y Y)而而言言,如如果果 X X 和和 Y Y 的的数数学学期期望望和和方方差差都都存存在在,这这时时 EXEX、DXDX、EYEY、DY DY 分分别别反映了随机反映了随机变变量量 X X 和和 Y Y 各自的部分特性。各自的部分特性。然然而而二二维维随随机机向向量量的的联联合合分分布布中中还还包包含含有有 X X 与与 Y Y 之之间间相相互互关关系系的的信信息息,能能不不能能像像数数学学期期望望和和方方差差那那样样,用用某某些些数数值值来来刻刻画画 X X 和和 Y Y 之之间间的的联联系系的的某某些特性呢?些特性呢?协协方方差差和和相相关关系系数数就就是是描描述述两两个个随随机机变变量量之之间间联联系的数字特征。系的数字特征。定定义义:设设(X X,Y Y)是一个二是一个二维维随机向量,且随机向量,且存在,存在,则则称称为为 X X 与与 Y Y 的协方差的协方差(Covariance)Covariance)。性性质质:设设 X X,Y Y 和和 Z Z 是是任任意意随随机机变变量量,且且它它们们的方差均存在,的方差均存在,则则(3 3)对对于任意常数于任意常数 a a 和和 b b,有有:证证明明:由由协协方方差差的的定定义义容容易易验验证证(2 2)和和(3 3),下面仅证(下面仅证(1 1)和()和(4 4)。)。(1 1)(4 4)性性质质:设设随机随机变变量量 X X 与与 Y Y 的方差存在,的方差存在,则则证证明明:由方差的定由方差的定义义知,知,类似地可以证明:类似地可以证明:推广:推广:设设 X1X1,XnXn 的方差均存在,的方差均存在,则则当当 X1X1,XnXn 不独立不独立时时,协协方方差差是是关关于于两两个个随随机机变变量量的的一一个个数数字字特特征征,它它的的数数值值在在一一定定程程度度上上反反映映了了这这两两个个随随机机变变量量相相互互间间的的某某种种关关系系,不不过过用用它它来来描描述述这这关关系系马马上上就就会发现一个不足的地方。会发现一个不足的地方。如如随随机机变变量量 X X和和Y Y各各自自增增大大 k k倍倍(k k 0 0),则则即协方差却为:即协方差却为:即即协协方方差差却却增增大大了了 倍倍。而而kX,kY相相互互之之间间的的联联系系与与 X,Y 之之间间的的关关系系从从直直观观上上看看并并无无差差别别。为为克克服服这这一一缺缺点点,可可在在计计算算协协方方差差之之前前,先先对对随随机机变变量量进进行行“标标准准化化”。故故引引入入相相关系数概念。关系数概念。定定义义:设设(X X,Y Y)为为二二维维随随机机向向量量,且且 X X 和和 Y Y 的的方差均存在,都为正方差均存在,都为正(0),则称,则称为为随随机机变变量量X X与与Y Y的的相相关关系系数数(coefficient coefficient of correlationof correlation)。)。易易见见,对对k 0,k 0,有有性质:性质:设设性质:性质:设设是是X X和和Y Y独立的充要条件。独立的充要条件。定定理理:(柯柯西西施施互互茨茨(CauchyCauchySchwarzSchwarz)不等式)不等式)证明:证明:对任意的实数对任意的实数 t t,考虑考虑 由于对于任意的实数由于对于任意的实数 t t 恒有恒有 即即故判故判别别式式 0 0,即即从而从而 定定理理 设设随随机机变变量量 X X 与与 Y Y 的的方方差差存存在在,相相关关系数系数为为则则有有:的的充充分分必必要要条条件件是是 X X 与与 Y Y 以以概概率率1线线性性相相关关,即即存在常数存在常数 a 与与 b,使有使有证证明:明:(1 1)令令运用运用柯西柯西-施瓦茨不等式,可得施瓦茨不等式,可得 即:即:证证明(明(2 2):由(由(1 1)的)的证证明明过过程可知:程可知:等价于等价于这这等价于等价于二次方程:二次方程:即:即:仅仅有一个重根有一个重根又因又因为为 即即所以所以令令的充分必要条件是:的充分必要条件是:即有:即有:而由性质而由性质(DX=0,有有 P(X=a)=1)知:知:定理表明:当定理表明:当时时,在,在X X与与Y Y之之间间存在着存在着线线性关系性关系的的事事件件概概率率为为1,即即 X X 与与 Y Y 之之间间线线性性关关系系不不成成立立的的事件的概事件的概概率为零。概率为零。当当这这种种线线性相关的程度随着性相关的程度随着,称称 X X 与与 Y Y 正正线线性相关;性相关;当当,称称 X X 与与 Y Y 负线负线性相关;性相关;当当的减小而减弱。的减小而减弱。时时,称,称X X与与Y Y不相关的,不相关的,即它即它们们没有没有线线性关系。性关系。由此可知,相关系数由此可知,相关系数 是是描描述述随随机机变变量量之之间间线线性性关系强弱的一个数字特征。关系强弱的一个数字特征。当当定定理理 若若随随机机变变量量 X X 与与 Y Y 相相互互独独立立,则则X X与与Y Y不相关;反之不然。不相关;反之不然。证证明:明:由于由于X X与与Y Y独立,即知独立,即知所以,所以,从而可知从而可知:即即X X与与Y Y不相关。不相关。特特别别注注意意:但但当当 X X 与与 Y Y 不不相相关关时时,X X 与与 Y Y 却不一定却不一定独立。独立。两两个个随随机机变变量量之之间间的的独独立立与与不不相相关关是是两两个个不同的概念。不同的概念。“不不相相关关”只只说说明明两两个个随随机机变变量量之之间间没没有有线线性性关关系系,但但可可能能存存在在其其他他函函数数关关系系,也也可可能能相相互互独立。独立。而而“独独立立”说说明明两两个个随随机机变变量量之之间间既既无无线线性性关系,也无其他函数关系。关系,也无其他函数关系。所以所以“独立独立”必必导导致致“不相关不相关”;反之不然。;反之不然。“独立独立”“不不独立独立”(无无任何任何关系关系)(有某种(有某种关系关系)相关相关 “不相关不相关”(有(有线线性关系性关系),(没有没有线线性关系性关系)关系可有强弱关系可有强弱(但但存存在在其其他他函函数关系数关系)“不相关不相关”(没有没有线线性关系性关系)没有任何其它关系没有任何其它关系随机随机变变量量 X X 与与 Y Y 的关系的关系例:例:设设随机向量(随机向量(X X,Y Y)的的联联合密度函数合密度函数为为求求:解解(1 1)先先计计算算DXDX、DYDY和和CovCov(X X,Y Y),再,再计计算算所以所以现再来计算相关系数得现再来计算相关系数得: