《模式识别》实验报告-贝叶斯分类.doc
《《模式识别》实验报告-贝叶斯分类.doc》由会员分享,可在线阅读,更多相关《《模式识别》实验报告-贝叶斯分类.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别实验报告 西安交通大学 高海南模式识别实验报告-最小错误率贝叶斯决策分类一、实验原理对于具有多个特征参数的样本(如本实验的iris数据样本有个参数),其正态分布的概率密度函数可定义为式中,是维行向量,是维行向量,是维协方差矩阵,是的逆矩阵,是的行列式。本实验我们采用最小错误率的贝叶斯决策,使用如下的函数作为判别函数(3个类别)其中为类别发生的先验概率,为类别的类条件概率密度函数。由其判决规则,如果使对一切成立,则将归为类。我们根据假设:类别,i=1,2,N的类条件概率密度函数,i=1,2,N服从正态分布,即有,那么上式就可以写为对上式右端取对数,可得上式中的第二项与样本所属类别无关,将
2、其从判别函数中消去,不会改变分类结果。则判别函数可简化为以下形式二、实验步骤(1)从Iris.txt文件中读取估计参数用的样本,每一类样本抽出前40个,分别求其均值,公式如下7clear% 原始数据导入iris = load(C:MATLAB7work模式识别iris.txt);N=40;%每组取N=40个样本%求第一类样本均值for i = 1:N for j = 1:4 w1(i,j) = iris(i,j+1); endendsumx1 = sum(w1,1);for i=1:4 meanx1(1,i)=sumx1(1,i)/N;end%求第二类样本均值for i = 1:N for j
3、 = 1:4 w2(i,j) = iris(i+50,j+1); endendsumx2 = sum(w2,1);for i=1:4 meanx2(1,i)=sumx2(1,i)/N;end%求第三类样本均值for i = 1:N for j = 1:4 w3(i,j) = iris(i+100,j+1); endendsumx3 = sum(w3,1);for i=1:4 meanx3(1,i)=sumx3(1,i)/N;end(2)求每一类样本的协方差矩阵、逆矩阵以及协方差矩阵的行列式,协方差矩阵计算公式如下其中代表类的第个样本,第j个特征值;代表类的个样品第j个特征的平均值代表类的第l个
4、样品,第k个特征值;代表类的个样品第k个特征的平均值。%求第一类样本协方差矩阵z1(4,4) = 0;var1(4,4) = 0;for i=1:4for j=1:4 for k=1:N z1(i,j)=z1(i,j)+(w1(k,i)-meanx1(1,i)*(w1(k,j)-meanx1(1,j); end var1(i,j) = z1(i,j) / (N-1); endend%求第二类样本协方差矩阵z2(4,4) = 0 ; var2(4,4) = 0;for i=1:4 for j=1:4 for k=1:N z2(i,j)=z2(i,j)+(w2(k,i)-meanx2(1,i)*(
5、w2(k,j)-meanx2(1,j); end ar2(i,j) = z2(i,j) / (N-1);endend%求第三类样本协方差矩阵z3(4,4) = 0 ; var3(4,4) = 0;for i=1:4for j=1:4 for k=1:N z3(i,j)=z3(i,j)+(w3(k,i)-meanx3(1,i)*(w3(k,j)-meanx3(1,j); end var3(i,j) = z3(i,j) /( N-1); endend%求各类的协方差矩阵逆矩阵及行列式var1_inv = ;var1_det = ;var2_inv = ;var2_det = ;var3_inv =
6、 ;var3_det = ;var1_inv = inv(var1)var2_inv = inv(var2)var3_inv = inv(var3)var1_det = det(var1)var2_det = det(var2)var3_det = det(var3)(3)对三个类别,分别取每组剩下的10个样本,每两组进行分类。由于每一类样本都相等,且每一类选取用作训练的样本也相等,在每两组进行分类时,待分类样本的类先验概率。将各个样本代入判别函数根据判决规则,如果使对一切成立,则将归为类。若取第一类后10个数据和第二类进行分类,代码如下M=10;for i = 1:M for j = 1:4
7、 test(i,j) = iris(i+50,j+1); % 取测试数据 endendt1=0;t2=0;t3=0;for i = 1:M x=test(i,1);y=test(i,2); z=test(i,3);h=test(i,4); g1 = (-0.5)*(x,y,z,h-meanx1)*var1_inv*(x,y,z,h-meanx1) - 0.5*log(abs(var1_det) + log(p1); g2 = (-0.5)*(x,y,z,h-meanx2)*var2_inv*(x,y,z,h-meanx2) - 0.5*log(abs(var2_det) + log(p2);
8、if g1g2 t1=t1+1 %若g1g2,则属于第一类,否则属于第二类,并统计属于每一类的个数 else t2=t2+1 endend同理第二类和第三类、第一类和第三类可进行分类。三、实验结果及分析(1)取第一类样本的后10个数据,按、分类,由t1=10可知,此10个数据属于,分类正确;同理,按、分类,由t1=10可知,此10个数据属于,分类正确。(2)取第二类样本的后10个数据,按、分类,由t2=10可知,此10个数据属于,分类正确;同理,按、分类,由t2=10可知,此10个数据属于,分类正确。(3)取第三类样本的后10个数据,按、分类,由t3=10可知,此10个数据属于,分类正确;同理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 实验 报告 贝叶斯 分类
限制150内