模式识别导论习题集(共12页).doc
精选优质文档-倾情为你奉上模式识别导论习题集1、设一幅256×256大小的图像,如表示成向量,其维数是多少?如按行串接成一维,则第3行第4个象素在向量表示中的序号。解:其维数为2;序号为256×245162、如标准数字1在5×7的方格中表示成如图所示的黑白图像,黑为1,白为0,现若有一数字1在5×7网格中向左错了一列。试用分别计算要与标准模板之间的欧氏距离、绝对值偏差、偏差的夹角表示,异己用“异或”计算两者差异。解:把该图像的特征向量为5×735维,其中标准模版的特征向量为:x=0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0T待测样本的特征向量为:y=0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0T因此欧氏距离为 ,绝对值偏差为,夹角余弦为,因此夹角为90度。3、哈明距离常用来计算二进制之间的相似度,如011与010的哈明距离为1,010与100距离为3。现用来计算7位LED编码表示的个数字之间的相似度,试计算3与其它数字中的哪个数字的哈明距离最小。解:是“9”,距离为14、对一个染色体分别用一下两种方法描述: (1)计算其面积、周长、面积/周长、面积与其外接矩形面积之比可以得到一些特征描述,如何利用这四个值?属于特征向量法,还是结构表示法?(2)按其轮廓线的形状分成几种类型,表示成a、b、c等如图表示,如何利用这些量?属哪种描述方法?(3)设想其他结构描述方法。解:(1)这是一种特征描述方法,其中面积周长可以体现染色体大小,面积周长比值越小,说明染色体越粗,面积占外接矩形的比例也体现了染色体的粗细。把这四个值组成一个维数为4的特征向量,该特征向量可以描述染色体的一些重要特征,可以按照特征向量匹配方法计算样本间的相似度。可以区分染色体和其它圆形、椭圆细胞结构。(2)a形曲线表示水平方向的凹陷,b形表示竖直方向的凹陷,c形指两个凹陷之间的突起,把这些值从左上角开始,按顺时针方向绕一圈,可以得到一个序列描述染色体的边界。它可以很好的体现染色体的形状,用于区分X和Y染色体很合适。这是结构表示法。(3)可以先提取待识别形状的骨架,在图中用蓝色表示,然后,用树形表示骨架图像。5. 设在一维特征空间中两类样本服从正态分布,=1,µ1=0,µ2=3,两类先验概率之比,试求按基于最小错误率贝叶斯决策原则的决策分界面的x值。解:按照公式(284),分界面上的点应满足:6. 设有两类正态分布的样本集,第一类均值,先验概率,现按基于最小错误率贝叶斯决策设计分类器,试求分类器得分界面。解:按照公式(284),分界面上的点应满足:7. 已知某一正态分布二维随机变量的协方差矩阵为,均值向量为零向量。试求其mahalanobis距离为1的点的轨迹。(不要求)8. 设有二维随机变量的分布如图a、b、c所示的三种情况,协方差矩阵表示成,试问这三种分布分别对应哪种情况(A. a12>0 B. a12<0 C. a120)?解:这3种情况都存在均值向量0,所以协方差矩阵为所以对于图a而言,明显有的平均值>0,因此aA,对于图b而言,明显有的平均值=0,因此bC, 对于图b而言,明显有的平均值<0,因此cB, a b c 图19. 什么叫对称矩阵?什么叫正定矩阵?半正定矩阵?试问协方差矩阵是否是对称矩阵?是否是正定矩阵或半正定矩阵?答:对称阵:aij=aji。正定阵:它的特征值都大于0。半正定阵:它的特征值都大于等于0。协方差矩阵是正定阵。10. 设有N个d维向量组成样本集,表示成X1,Xn,是任一个非奇异对称阵,证明使为最小的向量X是该样本集的均值向量。(不要求)证明:显然可以看出这是一个多元二次式。故极值位置是导数为零的位置,求导,得:,这是一个一次方程组,在处得零。故极值在这里取得。11. 设一个二维空间中的两类样本服从正态分布,其参数分别为,先验概率,试证明其基于最小错误率的贝叶斯决策分界面方程为一圆,并求其方程。证明:先验概率相等条件下,基于最小错误率贝叶斯决策的分界面上两类条件概率密度函数相等。因此有:化简为,是一个圆的方程12. 将上题推广到一般情况(不要求)(1) 若,,试说明先验概率相等条件下,基于最小错误率的贝叶斯决策面是否是超球面;(2) 它能否用mahalanobis距离平方为常数的轨迹表示(3) 用mahalanobis距离表示的轨迹,分析其与1,2的关系.13. 对两类问题,若损失函数,,试求基于最小风险贝叶斯决策分界面处的两类错误率与,的关系。(不要求)14. 思考题:如果有两类问题,1和2,现欲严格限制错将第二类误判成第一类的情况,那么应如何选择?(不要求)15. 证明在正定或半正定时,mahalanobis距离r符合距离定义的三个条件,即(不要求)(1) r(a,b)=r(b,a)(2) 当且仅当a=b时,有r(a,b)=0(3) r(a,c)r(a,b)+r(b,c)16、设五维空间的线性方程为,试求出其权向量与样本向量点积的表达式中的W,X以及增广权向量与增广样本向量形式 中的a与Y。 解:W=55 68 32 16 26T,X=x1 x2 x3 x4 x5 a=55 68 32 16 26 10T,Y=x1 x2 x3 x4 x5 117、上式是一个五维空间的超平面,试求该平面到坐标原点的法向距离。 解:根据式(4-8),该式的权向量的模为:而超平面到坐标原点的距离为18、设在三维空间中一个类别分类问题拟采用二次曲面。如欲采用广义线性方程求解。试向其广义样本向量与广义权向量的表达式,其维数是多少? 解:根据式(5-29)其中 可得:因此可令其广义样本向量为 广义权向量为19、设两类样本的类内离散矩阵分别为,均值向量试用fisher准则求其决策面方程。 解:由式(4-18)和(4-32)分别得总类内离散度矩阵和最佳投影方向为 因此,原二维空间的均值m1、m2在一维y空间中的投影分别为, 由于两类样本分布形状是相同的(只是方向不同),根据先验知识由式(4-33)选定分界阈值点y0应为两类均值的中点:即。20、设在一个二维空间,A类有三个训练样本,图中用红点表示,B类四个样本,图中用蓝点表示。 试问:(1) 按近邻法分类,这两类最多有多少个分界面(2) 画出实际用到的分界面(3) A1与B4之间的分界面有没有用到?解: (1)按近邻法,对任意两个由不同类别的训练样本构成的样本对,如果它们有可能成为测试样本的近邻,则它们构成一组最小距离分类器,它们之间的中垂面就是分界面,因此由三个A类与四个B类训练样本可能构成的分界面最大数量为3×412。(2)实际分界面如下图所示,由9条线段构成。 (3)没有用到。因为它可以用A1与B1的分界面代替。21、C-均值算法的准则函数为:,设两个集群的数据分别为与试求:1) 两个集群的均值。2) 若将数据从第一个集群转移至第二个时,准则函数值J0的变化量。解:1), 2) 从第一个集群中移出,准则函数值减少为该数据加入第二个集群值准则函数值增加值为(22、若数据集共有N个集群,总离散矩阵为(不要求)1)试求证某一数据x从转移至集群时,的离散矩阵变化量为其中是转移前集群的均值的量,是转移前的数据。2)推测在增加数据x后离散矩阵的变化量,以及总离散矩阵的变化量。23、 如果四个数据分别为:,以及它们的初始划分为以及试问:1) 若将移至集群,试求转移前后的总离散矩阵。2) 若用的行列式代为准则,这种转移是否合适? 3) 若将移至,用C均值算法的准则函数,这种转移是否合适?解:1)转移前的离散矩阵 转移后的离散矩阵 2) 转移前 转移后 按为准则,这种转移是合适的3) 按C均值算法先计算的值, 第一个集群准则函数值减少为, 第二个集群准则函数值增加, 由于13>,按C均值算法这种转移是不合适的。 24、若使用以下准则函数(不要求)其中是总离散矩阵,是第i个集群的均值向量。试证明对任何一种非奇异变换,该种准则函数具有不变性。25、已知有两类数据,分别为 (略)1 : (1, 0), (2, 0), (1, 1)2 : (-1, 0), (0, 1) , (-1, 1)试求:该组数据的类内及类间离散矩阵Sw及Sb。26、(1)将在多维正态分布的Bhattachryya距离表达式 (不要求)转换成用于两个一维正态分布及时的JB公式(2)两个一维正态分布,其期望与方差分别为第一组: 第二组: 求其Bhattacharyya距离。27、1)已知两个正态分布时的散度公式为试将其转换成一维正态分布下的式子。2)求上一题中两个一维正态分布的散度。解:1)在一维正态分布时2)对第一组对第二组28、对题25给出的数据,求使J2达到最大的特征提取。解:, 由式(4-19)和(4-20)得 由于该两类数据的Sb的秩为1,故特征提取后的维数为1,因此由式(8-63)可得最佳特征提取向量为29、已知有两个数据集,分别为 1 :(0,0,1),(1,1,1),(1,0,1)及(1,0,0)2 :(0,0,0),(1,1,0),(0,1,0)及(0,1,0)试求:(1) 将该8个数据作为一个数据集对其进行K-L变换(2) 求这两个数据集的类内离散矩阵,并以此作为其产生矩阵进行K-L变换解:1)求该八个数据的协方差矩阵先求该八个点的均值向量,得均方距离由于它已是一个对角矩阵,且主对角线元素值相等,因此无需进一步做K-L变换,原坐标系的基已经是K-L变换的基,并且任何一组正交基都可作为其K-L变换的基。2)分别求两组数据的均值及类内离散矩阵得,对Sw进行特征值分解得其特征值为1,4,4,对应于=1,特征向量,而对应于=4的特征向量没有唯一解。因此选为一维特征空间得坐标轴。专心-专注-专业