参数估计理论与应用第三章.ppt
《参数估计理论与应用第三章.ppt》由会员分享,可在线阅读,更多相关《参数估计理论与应用第三章.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共74页参数估计理论与应用第三章 在在许许多多情情况况下下,观观测测数数据据所所服服从从的的概概率率模模型型已已知知的的,而而模型的未知部分是以模型的未知部分是以未知参数形式出现未知参数形式出现的。的。参参数数估估计计的的基基础础是是优优 化化 理理 论论,即即被被估估计计的的参参数数应应 该该在在 某某种准则下种准则下是是最优最优的,以及任何获得最优的估计。的,以及任何获得最优的估计。非非参参数数估估计计方方法法不不假假定定观观测测数数据据服服从从某某种种特特定定的的概概率率模模型型。例例如如,频频 域域 上上的的谱谱 估估 计计与与谱谱 线线 拟拟 合合就就是是典典型型
2、的的非非 参参 数数 估估计方法计方法。观测到的状态观测到的状态状态状态控制控制x(t)y(t)u(t)v(t)w(t)观量噪声观量噪声设备噪声设备噪声设备(模型结构已设备(模型结构已知、参数未知)知、参数未知)测量装置测量装置图图3-1 3-1 系统辨识中的参数估计问题系统辨识中的参数估计问题现在学习的是第2页,共74页3.1 3.1 参数估计的评价准则参数估计的评价准则 参参 数数 估估 计计是是 通通 过过样样 本本去去估估 计计 总总 体体的的 某某 些些数数 字字 特特 征征或或统统 计计 量量。任任 何何 一一个统计量都可作为参数的估计量,但其效果的优劣有所差别。个统计量都可作为参
3、数的估计量,但其效果的优劣有所差别。3.1.1 3.1.1 无偏性、有效性与相容性无偏性、有效性与相容性 (1 1)无无 偏偏 性性 设设样样本本的的总总体体分分布布密密度度函函数数为为 p(x;),是是未未知知参参数数。从从总总体体中中抽抽取取容容量量为为 N 的的样样本本 x=x1,xN,用用 样样 本本 的的 估估 计计 量量 来来 估估 计计,如如 果果 希希 望望多多 次次 估估 计计 中中,平平 均均的估计值没有偏差的估计值没有偏差,即,即 则称则称 是是的的无偏估计量无偏估计量。现在学习的是第3页,共74页 例例3-13-1 样本均值是总体数学期望的无偏估计。样本均值是总体数学期
4、望的无偏估计。设设x1,xN 是是随随机机过过程程 xk 的的N个个独独立立观观测测样样本本,如如果果参数参数是总体的数学期望是总体的数学期望Ex,即用样本的均值,即用样本的均值作为作为的估计量,对该估计量取期望值,有的估计量,对该估计量取期望值,有 一一 个个 无无 偏偏 估估 计计 量量 在在 多多 次次 估估 计计 中中 将将 不不 会会 产产 生生系系 统统 偏偏 差差,但但并不意味着有偏估计就不好。如果一个有偏估计是渐进无偏并不意味着有偏估计就不好。如果一个有偏估计是渐进无偏的,即的,即现在学习的是第4页,共74页那么它仍然有可能是一个好的估计。那么它仍然有可能是一个好的估计。考虑实
5、随机过程考虑实随机过程xk的相关函数的两种估计量:的相关函数的两种估计量:假定数据假定数据xk是独立观测的,容易验证是独立观测的,容易验证 式中,式中,Rx()=E xk+xk 是随机数据是随机数据xk的相关函数。的相关函数。以以 上上 二二 式式 表表 明明,估估 计计 量量 1()是是 无无 偏偏 的的,而而 2()则则 是是有偏的。但是,有偏的。但是,2()是渐进无偏的是渐进无偏的,即,即现在学习的是第5页,共74页渐渐 进进 无无 偏偏 估估 计计 量量 2()是是半半 正正 定定的的,而而 无无 偏偏 估估 计计 量量 1()却却不一定是半正定的,故不一定是半正定的,故 2()的使用
6、场合较多。的使用场合较多。(2 2)有有效效性性 如如果果 1 和和 2 是是两两个个根根据据N个个独独立立观观测测样样本本得得到到的的无无偏偏估估计计量量,无无疑疑地地,对对 的的平平均均偏偏差差较较小小是是选选择择的标准之一。例如,如果的标准之一。例如,如果则则 1的的值值比比 2 的的值值更更密密集集地地聚聚集集在在真真 值值的的附附 近近。通通常常将将 方方差差(或或 协协 方方 差差 阵阵)在在 所所 有有 的的 无无 偏偏 估估 计计 量量 中中 达达 到到 最最 小小 的的 称称 为为有效估计量有效估计量。例例3 3-2 2 设设x1,xN 是是 N个个 独独 立立 观观 测测
7、样样 本本,若若 被被 估估 计计 参参 数数现在学习的是第6页,共74页=Ex,则对任何满足,则对任何满足都是都是的无偏估计量。利用不等式的无偏估计量。利用不等式 可得可得在估计总体的数学期望时,简单的在估计总体的数学期望时,简单的算术平均算术平均比比加权平均加权平均好。好。(3 3)一一致致性性 估估计计量量的的精精度度是是与与样样本本的的容容量量 N 有有 关关 系系的的。一一 般般 说说 来来,总总 是是 认认 为为N 越越 大大 估估 计计 的的 效效 果果 应应 该该 越越 好好。如如 果果记依赖样本容量记依赖样本容量 N 的估计为的估计为 N,当满足,当满足现在学习的是第7页,共
8、74页则称则称 N 是是的的一致性估计量一致性估计量,或,或相容估计相容估计。例例3-33-3 设总体设总体 x 具有均匀分布,分布密度为具有均匀分布,分布密度为其中,其中,1 和和2 是未知参数。是未知参数。总体样本总体样本的的均值均值和和二阶矩二阶矩分别为(严格按定义计算)分别为(严格按定义计算)解得解得现在学习的是第8页,共74页 按按矩矩的的估估计计方方法法,用用独独立立样样本本的的均均 值值和和独独立立样样本本的的二二 阶阶矩矩,分别作为,分别作为总体总体均值均值和和二阶矩二阶矩的的估计量估计量,就有,就有 下面说明下面说明 1 和和 2 分别是分别是1 和和2 的的相容估计相容估计
9、。设设 y1,yN 是是具具有有同同分分布布的的独独立立观观测测样样本本,根根据据大大数数定定律,有律,有令令y=x2,就有就有现在学习的是第9页,共74页于是于是3.1.2 Fisher3.1.2 Fisher信息和信息和Cramer-RaoCramer-Rao不等式不等式 通常希望获得有效的参数估计量。但是,由于不存在导通常希望获得有效的参数估计量。但是,由于不存在导致最小方差无偏估计量的最佳算法,所以通常采用参数无偏致最小方差无偏估计量的最佳算法,所以通常采用参数无偏估计的估计的Cramer-Rao下限下限(或或CR下界下界),作为评价参数估计性能作为评价参数估计性能的测度。为了简洁叙述
10、这一的评价测度,先定义一个重要的的测度。为了简洁叙述这一的评价测度,先定义一个重要的概念。概念。Fisher 信息信息 Fisher 信息用信息用J()表示,定义为)表示,定义为(3.1.13.1.1)现在学习的是第10页,共74页 当当 考考 虑虑 N 个个观观测测样样本本 X=x1,xN,此此时时,联联合合条条件件分分布密度函数可表示为布密度函数可表示为 将将 式式(3 3.1 1.1 1)中中 的的p(x|)改改 为为p(X|)就就 可可 给给 出出N个个 样样 本本变量变量X的的Fisher信息的表达式。信息的表达式。定定 理理(C Cr ra am me er r-R Ra ao o
11、不不 等等 式式)设设 观观 测测 样样 本本X=x1,xN,若若参参数数估估计计 是是真真实实参参数数 的的无无偏偏估估计计,并并且且条条件件分分布布密密度度函数的函数的p(X|)对参数对参数 的一、二阶偏导数存在,则有的一、二阶偏导数存在,则有(3.1.23.1.2)参参数数 的的方方差差所所能能达达到到的的下下限限(称称为为CR下下限限),即即上上式式等号成立等号成立的充要条件是的充要条件是现在学习的是第11页,共74页其中其中,函数函数K()0,并与样本向量并与样本向量 X 无关无关。当当 为有偏估计量时,为有偏估计量时,Cramer-Rao 不等式为不等式为(3.1.33.1.3)式
12、式 中中()为为 估估 计计 偏偏 差差,即即()=E -,并并 假假 定定b()是是 可可微分的。微分的。对对 于于 多多 个个 参参 数数 的的 情情 况况,记记=1,p,则则 用用 矩矩阵阵J()表示表示Fisher信息,其元素信息,其元素Jij()定义为定义为(3.1.43.1.4)现在学习的是第12页,共74页且且Cramer-Rao不等式变为矩阵不等式:不等式变为矩阵不等式:(3.1.53.1.5)上上式式表表示示无无偏偏估估计计量量的的协协方方差差矩矩阵阵cov()与与 逆逆Fisher信信 息息 阵阵之差之差是一是一半正定矩阵半正定矩阵。Fisher信信 息息是是描描述述从从观
13、观测测数数据据中中得得到到的的 的的“信信 息息”测测度度,它它给给出出利利用用观观测测数数据据估估计计参参数数的的方方差差下下界界。但但 是是,满满足这一下界的估计量有的时候可能不存在足这一下界的估计量有的时候可能不存在。3.2 3.2 基于统计分布的参数估计方法基于统计分布的参数估计方法 参参数数估估计计量量的的优优劣劣取取决决于于所所采采用用的的评评价价准准则则(或或代代价价函函数数)和和估估计计算算法法。现现在在介介绍绍已已知知总总体体统统计计分分布布的的两两种种最最有有效效的参数估计方法:的参数估计方法:Bayes 估计估计和和最大似然估计最大似然估计。现在学习的是第13页,共74页
14、3.2.1 Bayes 3.2.1 Bayes 估计估计 在参数估计中,估计误差在参数估计中,估计误差-通常不为零。因此,除了通常不为零。因此,除了采用前面介绍的采用前面介绍的无偏无偏、有效有效和和相容估计相容估计作为评价准则外,还作为评价准则外,还可以利用可以利用估计误差估计误差的变化范围的变化范围作为参数估计作为参数估计的的测度测度,这种测,这种测度叫做度叫做代价函数代价函数,用符号,用符号C(,)表示。常用的代价函数有表示。常用的代价函数有绝对型绝对型、二次型二次型和和均匀型均匀型三种。三种。OOO/2/2绝对型绝对型二次型二次型均匀型均匀型现在学习的是第14页,共74页 本节仅介绍最常
15、用的本节仅介绍最常用的二次型二次型代价函数,即代价函数,即 当总体的分布密度函数当总体的分布密度函数p(X|)已知时,利用已知时,利用X=x1,xN 进行参数估计,通常是采用进行参数估计,通常是采用代价函数代价函数的的期望值期望值作作为为评评价价参参数数估估计计量量效效果果的的测测度度,并并称称之之为为风风 险险 函函 数数。使使 风风险险函函数数最最小小的的参参数数估估计计叫叫做做 Bayes 估估 计计;基基于于二二次次型型风风险险函函数数最最小小的的估估计计称称为为最最小小均均方方误误差差(minimum mean square error,MMSE)估计)估计。二次型风险函数定义为。二
16、次型风险函数定义为(3.2.13.2.1)根据条件概率公式,有根据条件概率公式,有现在学习的是第15页,共74页其其中中,p(|x1,xN)是是给给定定N个个观观测测样样本本X=x1,xN 条条 件件下下 的后验分布密度函数。于是,式(的后验分布密度函数。于是,式(3.2.13.2.1)可以写成)可以写成(3.2.23.2.2)为为 使使风风险险函函数数RM M S E 最最 小小,对对上上式式取取 的的偏偏导导,并并令令其其结果为零,便得到结果为零,便得到由由 于于p(x1,xN)是是 非非 负负 的的,因因 此此,RM M S E/=0,等等 价价 于于上式中上式中=0。故有。故有现在学习
17、的是第16页,共74页(3.2.33.2.3)注意,在式(注意,在式(3.2.33.2.3)中,利用了以下事实:)中,利用了以下事实:由此可得出重要的结论:未知参数由此可得出重要的结论:未知参数 的的MMSE估计是给估计是给定样本定样本X条件下条件下的条件均值。的条件均值。例例3 3-4 4 某某一一随随机机参参量量x 服服从从高高斯斯N(mx,Cx)分分布布,用用仪仪器器可测量其线性组合可测量其线性组合y,即,即(1 1)式中,式中,yN 维,维,kNM 维,维,x M维,维,e N 维。维。现在学习的是第17页,共74页其中,测量误差其中,测量误差 e 服从高斯服从高斯N(0,Ce)分布;
18、分布;k 为给定的常数为给定的常数阵。假设阵。假设 ()e 与与 x 独立;独立;()e 与与 x 相关,互协方差函数为相关,互协方差函数为Cxe。试试 分分 别别 求求 出出 两两 种种 情情 况况 下下 的的M M S E估估 计计x(y)和和估估 计计 误误 差差x (y)的的协方差协方差R x(y)。解解 如如 果果将将 x 看看作作未未知知参参数数,那那么么,根根据据上上面面讨讨论论,x 的的MMS E 估估 计计是是给给定定观观测测样样本本y1,yN 时时 x 的的条条件件均均值值。因因此,可利用公式(此,可利用公式(1.4.16)和()和(1.4.17)pp.29(2 2)(3
19、3)来求解。来求解。现在学习的是第18页,共74页 对式(对式(1)两边取均值,得到)两边取均值,得到 (4 4)将式(将式(1)和()和(3)代入有关定义式,得)代入有关定义式,得(5 5)(6 6)(7 7)现在学习的是第19页,共74页(i)当)当 e与与 x 互相独立,互相独立,Cxe=0。将式(。将式(4)(7)代入)代入式(式(2)和()和(3),得到),得到x(y)的估计及协方差的估计及协方差R x(y)(ii)当)当 e 与与 x 相关,只需注意相关,只需注意Cxe 0即可。即可。这这个个问问题题留留给给读读者者解解决决。请请构构造造一一组组数数据据,在在M atlab 平平台
20、上仿真这两种的估计结果。台上仿真这两种的估计结果。3.2.2 3.2.2 最大似然估计最大似然估计 最最 大大 似似 然然 估估 计计(maximum likelihood estimate,M L估估计计)的的基基本本思思路路是是:在在给给定定参参数数条条件件下下,将将观观测测样样本本 x xK现在学习的是第20页,共74页联联合合条条件件概概率率密密度度函函数数p(x|)视视 为为真真 实实 参参 数数 的的 函函 数数,即即似似然然 函函 数数L(x,)(包包 含含 未未 知知 参参 数数的的 可可 能能 性性 函函 数数),然然 后后 利利用用 容容 量量 为为 N 的的 观观 测测
21、样样 本本x=x1,xN,求求 出出使使L(x,)达达 到到最最 大大 化化的的参参 数数 作作 为为=1,p的的估估 计计 值值。在在 数数 学学上,通常将未知参数上,通常将未知参数 的最大似然估计量记为的最大似然估计量记为式式 中中是是 参参 数数 的的 值值 域域。故故M L估估 计计 量量 ML就就 是是p(x|)的的 全全局极大点。局极大点。由由 于于 对对 数数 函函 数数 是是 严严 格格 单单 调调 的的,故故 L(x,)的的 极极 大大 点点 与与ln L(x,)的的 极极 大大 点点 是是 一一 致致 的的。通通 常常,将将ln L(x,)称称 为为对对数似然函数数似然函数
22、。于是,。于是,ML估计量估计量 ML可由可由(3.2.43.2.4)现在学习的是第21页,共74页确确 定定。如如 果果 x1,xN 是是N个个独独立立的的观观测测样样本本,则则对对数数似似然然函函数可写作数可写作(3.2.53.2.5)ML估估计计量量 ML只只要要能能够够求求出出来来,总总是是比比较较好好的的估估计计,它它具具有有以以下下性性质质:最最大大似似然然估估计计是是有有效效和和一一致致估估计计;对对于于大大的的N,M L估估 计计 量量 ML服服从从高高斯斯分分布布,并并且且是是无无偏偏的的,方方差差可可达达CR下界。下界。例例3 3-5 5 设设 样样 本本x=x1,xN 服
23、服 从从 高高 斯斯 分分 布布N(m,),则其对数似然函数为则其对数似然函数为现在学习的是第22页,共74页分别求分别求 lnL 关于关于 m 和和2 的偏导,并令它们等于零,得到的偏导,并令它们等于零,得到解得解得显然有显然有 可可见见,均均值值的的ML估估 计计 ML 是是无无偏偏的的,而而方方差差的的ML估估 计计 ML是是 有有 偏偏 的的。但但 若若 将将 ML N/(N-1)作作 为为 新新 的的 估估 计计 量量,则则 该该估计是无偏的。估计是无偏的。现在学习的是第23页,共74页 计算计算L(x,)的相对于的相对于m 的二阶偏导数,有的二阶偏导数,有 由式(由式(3.1.13
24、.1.1)得)得Fisher 信息:信息:Cramer-Rao不等式为不等式为等号成立的充要条件是等号成立的充要条件是事实上,我们有事实上,我们有现在学习的是第24页,共74页因因 此此,只只 要要 取取K(m)=N/2,M L估估 计计 M L就就 可可 达达C R下下 界界2/N。这表明。这表明ML估计估计 ML是一有效估计量。是一有效估计量。例例3 3-6 6(二二元元阵阵最最大大似似然然测测向向系系统统)设设二二元元阵阵布布置置在在 x轴轴 上上,两两 个个 基基 元元 坐坐 标标 分分 别别 为为x1 和和 x2,如如 图图3-2所所 示示。如如 果果 取取x1=0,则则 x2=d,
25、d为为两两传传感感器器的的位位置置间间隔隔。假假设设信信号号为为平平面面波,入射角为波,入射角为,则传感器,则传感器1相对于传感器相对于传感器2的信号时延的信号时延为为 (3.2.63.2.6)式式中,中,c 为声速。我们的问题是为声速。我们的问题是如何利用二元阵中两个输入过程如何利用二元阵中两个输入过程的时差的时差来测定目标的方位角来测定目标的方位角。xx2=dx1=0图图3-23-2 二元阵测向系统的几何关系二元阵测向系统的几何关系现在学习的是第25页,共74页 解解 设两传感器的零均值接收过程可分别表示为设两传感器的零均值接收过程可分别表示为其其 中中,si 为为 单单 频频 平平 面面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 理论 应用 第三
限制150内