the 动态测量数据的抗扰性分析研究3 guide download.pdf
《the 动态测量数据的抗扰性分析研究3 guide download.pdf》由会员分享,可在线阅读,更多相关《the 动态测量数据的抗扰性分析研究3 guide download.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、动态测量数据的抗扰性分析研究33 收稿日期:94年9月27日.收到修改稿日期:94年12月13日.范金城(西安交通大学理学院,西安,710049)胡 峰(西安卫星测控中心,西安,710043)摘 要 本文,从异常值的识别与滤波算法的抗扰性分析等方面,总结了动态测量数据的抗扰性处理技术的研究现状.1 引 言本文所谓的抗扰性(resistance),是指数据处理方法对采样数据及处理模型的微小扰动的不敏感性,它是统计决策的稳健性(robustness)理论在工程数据的探索性分析与高精度处理中应用的体现.换句话说,稳健性是抗扰性的概率表征2.抗扰性的研究工作最早见于Mosteller和Tukey(19
2、77)及其所引用的文献中.Huber(1981)对抗扰性给出了如下的描述性定义:“一个有限样本估计泛函Tn,如果数据的微小变动仅能导致估计泛函Tn的微小改变,我们则称它为抗扰的”.当然,Huber(1981)的这一定义主要是从统计学角度提出的,它未能反映模型的微小改变对估计量的影响.其实,在工程统计与过程控制中,经常会出现如下三种类型的“微小改变”:(1)由于信号记录设备的故障、操作人员的过失或其他原因,采样数据的集合中往往含有少量的异常值(outliers).也就是说,在采样序列中,出现小部分样本点明显偏离大部分数据所呈现的趋势;(2)由于信号记录设备精度的限制与记录时舍入误差的影响,采样点
3、列的数据大小只是目标真实状态的一组近似.即,大部分观测值都包含有微小的误差;(3)对工程数据进行处理时,总是对目标的运动状态进行一些简化与模型假定.但是,假定的理想化模型通常只是目标运行轨迹的一个近似描述.简单地说,情况(1)反映的是“小部分数据的巨大改变”,情况(2)反映的是“大部分数据的微小变动”,而(3)则反映的是模型设计可能出现的“微小扰动”.抗扰性研究,主要分析各种工程信号处理方法对数据的微小扰动(包括情形(1)、(2)及对模型的微小扰动(情形(3)的敏感性,并构造出具有良好抗扰性能的、易于工程实现的新的数据处理程序.11卷 第3期1996年9月数理统计与应用概率Mathematic
4、al Statistics and Applied ProbabilityVol.11,No.3Sep.1996 1995-2004 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.本文,将从动态测量数据序列的异常样本点识别方法、抗扰法滤波方法和抗扰性能的评价体系等方面,对工程数据处理的抗扰性研究的发展作一简单回顾.2 异常值识别方法的研究与发展异常值的定义一直不很明确,不同的学者给其赋予的内涵也不尽相同19.最初,Edgeworth(1887)认为,异常值是“显然严重偏离了样本集合中其它观测值的观测值”20.这个纯主观的基
5、于数据的定义,对于简单随机抽样或可重复抽样的样本点的异常性描述是十分合适的.文21基于这种定义,从工程应用的角度综述了可重复抽样情况下异常值识别技术的发展状况,及工程实现时的一些问题.Edgeworth的关于异常值的定义影响了近一个世纪,直到本世纪70年代仍被采用.Knsch(1984)从时间序列分析的稳健化研究出发,首次提出了异常数据的生成模型,讨论了AO模型与IO模型下异常值的特点,并将动态测量数据集合中的异常值分为孤立型异常值、相依型异常值和异常值斑点三大类11.通过参考Knsch(1984)对异常值生成模型的合理描述,并充分吸收Edgeworth(1887)定义、文3定义的优点,文19
6、从工程信号处理的实际出发,建议采用异常数据的定义为:“集合Dn中严重偏离大部分数据所呈现趋势的小部分数据点.”本定义强调主体数据所呈现的趋势,以此为判别异常数据的指标,并明确指出异常数据在集合Dn中只占小部分(即最多不超过一半),这从直观上也是合理的.本定义不但可以覆盖简单随机抽样情形,包括了Edgeworth(1887)的定义,而且还覆盖了动态测量数据序列及随机系统中的异常数据情形.对于“异常值的识别方法”这一与工程应用密切相关的统计学课题,历史上曾有众多的统计学者(例如,Barnett和Lewis(1978),Anscombe(1960),Grubs(1969),Rousseeuw(198
7、7),Kale(1970)及5等)从回归分析、方差分析、试验设计、影响分析及数据变换等多方面对之做了大量的探索与研究.Huber(1964,1981)、Hample,et.al(1987)与Knsch(1984)等则从尽量减小数据与模型的微小扰动对统计决策不利影响的角度,提出和发展了稳健统计、稳健信号处理和稳健随机控制理论.采样数据中异常值的识别既是一个数据处理方面的课题,更多的还是一个应用统计问题.从本世纪六十年代末和七十年代初开始,这一问题受到应用统计与工程控制领域的广泛重视.Tukey(1976)根据数据处理的实际需要,以抗扰性分析为核心,系统介绍了探索性数据分析(Exploratory
8、 Data Analysis)方法;文19不但综述了动目标测量数据的常见识别方法,还首次提出了多个异常数据的“稳健2似然比检验”方法,并讨论了随机系统的异常值识别问题.近年来,随着高速计算机的迅速普及、采样数据集合越来越大、样本空间维数越来越高,识别异常样本数据的各种新方法(例如,统计图形法(Statistical Graphics)、投影寻踪(Projection Pursuit)法26以及统计诊断(Statistical Diagnostics)理论5)相继问世,并在数542第11卷第3期范金城等:动态测量数据的抗扰性分析研究 1995-2004 Tsinghua Tongfang Opt
9、ical Disc Co.,Ltd.All rights reserved.据处理和信号分析等领域得以广泛应用.3 抗扰性滤波的进展自从六十年代初期的状态空间理论和Kalman滤波算法提出以后,动态测量数据的工程处理方法在近三十年来无论从理论还是从处理技术上都有了长足的进展.但是,Kalman滤波从本质上看仍然是一组最优线性滤波.当采样数据中出现异常值时,它同其它的线性滤波方法一样,对异常值反应十分敏感.为了克服Kalman滤波的这些不利于工程应用的缺陷,信号处理、随机控制和应用统计等领域的专家学者对此进行了大量的探索研究.Martin(1983)首次从信号的频域分析的角度提出了“稳健2抗扰谱
10、分析”技术;Samarov(1986)从理论上提出了稳健谱回归的理论;随后Martin和Yohai(1986)从统计量的影响函数和灵敏度分析的角度,改进了Knsch(1984)提出的AR-模型的影响度量,并进行了推广.在状态空间的模型结构分析方面,Sage和Melsa(1978)讨论并计算了各种模型扰动的灵敏度;Hwang和Bhattacharyya(1987)从结构灵敏度的角度讨论了状态估计的稳健平稳化问题.利用稳健-抗扰性分析方法改进控制器的性能,这是近年来控制理论领域的一个研究热点:Ioannou和Tiakali(1986)提出了“稳健直接自适应控制器”的构想,Narendra和Anna
11、swarry(1986)讨论了出现有界分布时的自适应控制技术;Martin和Mintz(1983)则从对策论的角度考虑了线性随机系统的稳健滤滤和预报问题.近年来,这方面的研究十分活跃.在工程数据处理中,人们更关心的是能否构造出一些滤波方法,它们既保持一定的最优性又具备良好的抗扰性.对此,文13将稳健统计的M型估计方法推广到动态测量系统Xk+1=kXk+EkkYk=HkXk+Nkk的状态滤波上来,给出了M滤波估计的一般化方程、收敛的迭代算法,并从理论上证明了M型具有良好的抗扰性.另一种构造稳健-抗扰滤波的方法是,以递推的Kalman滤波算法为基础,并进行适当的抗异常值修正.文14中介绍的有界影响
12、滤波算法较好地体现了这一思想.有界影响滤波,形式上类似于递推的Kalman滤波算法,但它采用规范化的新息增量(Innovation)的大小来度量数据的异常程度,并以之修正后继的滤波算法,达到抗异常数据的效果.文14不但给出了最优 函数的取法,还给出了仿真计算结果.从仿真结果看,当样本中不含异常值时,滤波估计值接近Kalman滤波值;反之,当数据序列中含有异常值时,有界影响滤波的效果明显优于Kalman滤波的效果.抗扰性预报方面,Preston(1979)提出了“稳健预报”的问题;文9将有界影响滤波与M型滤波技术应用于随机系数的状态预报,并给出了两组易于工程实现的抗扰性预报642数理统计与应用概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- the 动态测量数据的抗扰性分析研究3 guide download 动态 测量 数据 抗扰性 分析研究
限制150内