模式识别练习题(简答和计算)(共15页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《模式识别练习题(简答和计算)(共15页).doc》由会员分享,可在线阅读,更多相关《模式识别练习题(简答和计算)(共15页).doc(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上1、试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系。答:Mahalanobis距离的平方定义为: 其中x,u为两个数据,是一个正定对称矩阵(一般为协方差矩阵)。根据定义,距某一点的Mahalanobis距离相等点的轨迹是超椭球,如果是单位矩阵,则Mahalanobis距离就是通常的欧氏距离。2、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明这两种学习方法的定义与它们间的区别。答:监督学习方法用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号的
2、数据集组成,因此监督学习方法的训练过程是离线的。 非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。 就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。 使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。3、已知一组数据的协方差矩阵为,试问(1) 协方差矩阵中各元素的含义。(2) 求该数组的两个主分量。(3) 主分量分析或称K-L变换,它的最佳准则是什么?(4) 为什么说经主分量
3、分析后,消除了各分量之间的相关性。答:协方差矩阵为,则(1) 对角元素是各分量的方差,非对角元素是各分量之间的协方差。(2) 主分量,通过求协方差矩阵的特征值,用0得,则 ,相应地:,对应特征向量为,对应。这两个特征向量,即为主分量。(3) K-L变换的最佳准则为:对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小。(4) 在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关性消除。4、试说明以下问题求解是基于监督学习或是非监督学习:(1) 求数据集的主分量(2) 汉字识别(3) 自组织特征映射(4) CT图像的分割答:(1) 求数据集的主分量是非监
4、督学习方法;(2) 汉字识别:对待识别字符加上相应类别号有监督学习方法;(3) 自组织特征映射将高维数组按保留近似度向低维映射非监督学习;(4) CT图像分割按数据自然分布聚类非监督学习方法;5、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。答:线性分类器三种最优准则:Fisher准则:根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。这种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。其优点是通过错分类样本提供的信息对分类器函数进
5、行修正,这种准则是人工神经元网络多层感知器的基础。支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。6、试分析五种常用决策规则思想方法的异同。答、五种常用决策是: 1. 基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出使得错误率最小的分类规则。 2. 基于最小风险的贝叶斯决策,引入了损失函数,得出使决策风险最小的分类。当在0-1损失函数条件下,基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。 3. 在限定一类错误率条件下使另一类错误率最小的两类别决策。 4. 最大最小决策:类先验概率未知,考察先验概率
6、变化对错误率的影响,找出使最小贝叶斯奉献最大的先验概率,以这种最坏情况设计分类器。 5. 序贯分类方法,除了考虑分类造成的损失外,还考虑特征获取造成的代价,先用一部分特征分类,然后逐步加入性特征以减少分类损失,同时平衡总的损失,以求得最有效益。7、 1. 什么是特征选择?2. 什么是Fisher线性判别?答:1. 特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。 2. Fisher线性判别:可以考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维,这在数学上容易办到,然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,如果把它们投影到一条任意
7、的直线上,也可能使得几类样本混在一起而变得无法识别。但是在一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分开得最好。问题是如何根据实际情况找到这条最好的、最易于分类的投影线,这就是Fisher算法所要解决的基本问题。8、写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。两类问题:判别函数 决策面方程:C类问题:判别函数 ,决策面方程:,数据获取预处理特征提取与选择分类决策分类器设计信号空间特征空间9、请论述模式识别系统的主要组成部分及其设计流程,并简述各组成部分中常用方法的主要思想。信息获取:通过测量、采样和量化,可以用矩阵或向量表示二维图像或波形。预处理:去除
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 练习题 计算 15
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内