模式识别实验报告(共20页).doc
《模式识别实验报告(共20页).doc》由会员分享,可在线阅读,更多相关《模式识别实验报告(共20页).doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上实验一Bayes分类器设计本实验旨在让同学对模式识别有一个初步的理解,能够根据自己的设计对贝叶斯决策理论算法有一个深刻地认识,理解二类分类器的设计原理。1实验原理最小风险贝叶斯决策可按下列步骤进行:(1)在已知,i=1,,c及给出待识别的的情况下,根据贝叶斯公式计算出后验概率:j=1,,x (2)利用计算出的后验概率及决策表,按下面的公式计算出采取,i=1,,a的条件风险,i=1,2,a(3)对(2)中得到的a个条件风险值,i=1,,a进行比较,找出使其条件风险最小的决策,即则就是最小风险贝叶斯决策。2实验内容假定某个局部区域细胞识别中正常()和非正常()两类先验概率
2、分别为正常状态:P()=0.9;异常状态:P()=0.1。现有一系列待观察的细胞,其观察值为:-3.9847 -3.5549 -1.2401 -0.9780 -0.7932 -2.8531 -2.7605 -3.7287 -3.5414 -2.2692 -3.4549 -3.0752 -3.9934 2.8792 -0.9780 0.7932 1.1882 3.0682-1.5799 -1.4885 -0.7431 -0.4221 -1.1186 4.2532 已知类条件概率密度曲线如下图:类条件概率分布正态分布分别为(-2,0.25)(2,4)试对观察的结果进行分类。3 实验要求1) 用ma
3、tlab完成分类器的设计,要求程序相应语句有说明文字。2) 根据例子画出后验概率的分布曲线以及分类的结果示意图。3) 如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:状态决策106210请重新设计程序,画出相应的后验概率的分布曲线和分类结果,并比较两个结果。最小错误率贝叶斯决策试验程序x=-3.9847,-3.5549,-1.2401,-0.9780,-0.7932, -2.8531,-2.7605,-3.7287,-3.5414 ,-2.2692,-3.4549,-3.0752,-3.9934,2.8792,. -0.9780,0.7932,1.1882 ,3.0682 ,-1.
4、5799 ,-1.4885 ,-0.7431 ,-0.4221 ,-1.1186 ,4.2532 ;num=24; %输入的特征值个数result=zeros(1,num);%存放分类结果e1=-2; %正常细胞的特征均值a1=0.5; %正常细胞的特征标准差e2=2; %异常细胞的特征均值a2=2; %异常细胞的特征标准差pw1=0.9; %正常细胞出现的概率pw2=0.1; %异常细胞出现的概率for i=1:num pw1_x=normpdf(x(i),e1,a1)*pw1; %正常细胞后验概率的分子 pw2_x=normpdf(x(i),e2,a2)*pw2; %异常细胞后验概率的分子
5、 if pw1_xpw2_x result(i)=1; %识别结果为正常细胞 endenda=-5:0.05:5;n=numel(a);pw1_plot=zeros(1,n);pw2_plot=zeros(1,n);for j=1:n pw1_plot(j)=(pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2);%正常细胞后验概率 pw2_plot(j)=(pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2);
6、%异常细胞后验概率endfigure(1);hold on;plot(a,pw1_plot,k-,a,pw2_plot,r-.);for k=1:num if result(k)=1 plot(x(k),-0.1,b*);%正常细胞分布 else plot(x(k),-0.1,rp);%异常细胞分布 endendlegend(正常细胞后验概率曲线,异常细胞后验概率曲线,正常细胞,异常细胞);xlabel(样品细胞特征值);ylabel(后验概率);title(后验概率分布曲线);grid on;实验结果带的曲线为判决成异常细胞的后验概率曲线;另一条平滑的曲线为判为正常细胞的后验概率曲线。根据最
7、小错误概率准则,判决结果见曲线下方,其中“*”代表判决为正常细胞,“五角星”代表异常细胞各细胞分类结果。 最小风险贝叶斯决策分类器设计 实验程序x = -3.9847 , -3.5549 , -1.2401 , -0.9780 , -0.7932 , -2.8531 ,-2.7605 , -3.7287 , -3.5414 , -2.2692 ,. -3.4549 , -3.0752 , -3.9934 , 2.8792 , -0.9780 , 0.7932 , 1.1882 , 3.0682, -1.5799 , -1.4885 , -0.7431 , -0.4221 , -1.1186 ,
8、 4.2532 ;disp(x) pw1=0.9 ;%第一类的先验概率pw2=0.1 ;%第二类的先验概率m=numel(x); %样品个数 R1_x=zeros(1,m) ;%判为第一类的条件风险R2_x=zeros(1,m) ;%判为第二类的条件风险 result=zeros(1,m) ;%识别结果e1=-2; %第一类的均值a1=0.5 ;%第一类的标准差e2=2 ;%第二类的均值a2=2 ;%第二类的标准差%决策表r11=0 ;r12=2 ;r21=4 ;r22=0 ; %计算条件风险for i=1:m R1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*
9、normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2)+r21*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2); R2_x(i)=r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2)+r22*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2) ;end for i=1:m i
10、f R2_x(i)R1_x(i)% result(i)=0; else result(i)=1; end end a=-5:0.05:5;n=numel(a); R1_plot=zeros(1,n) ;R2_plot=zeros(1,n); for j=1:n R1_plot(j)=r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)+r21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2); R2_
11、plot(j)=r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)+r22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2); end figure(1) hold on plot(a,R1_plot,b-,a,R2_plot,g*-) for k=1:m if result(k)=0 plot(x(k),-0.1,b) else plot(x(k),-0.1,go) end; end; legen
12、d(正常细胞,异常细胞,Location,Best) xlabel(细胞分类结果) ylabel(条件风险) title(风险决策曲线) grid on实验结果其中带*的绿色曲线代表异常细胞的条件风险曲线;另一条光滑的蓝色曲线为判为正常细胞的条件风险曲线。根据贝叶斯最小风险判决准则,判决结果见曲线下方,其中“上三角”代表判决为正常细胞,“圆圈“代表异常细胞。 比较分析:在图1中,这两个样本点下两类决策的后验概率相差很小,当结合最小风险贝叶斯决策表进行计算时,“损失因素”就起了主导作用,导致出现了相反的结果。实验二三 多分类Bayes分类器设计数据集为Mnistall 数据集,加载到内存,解析数
13、据集的组织结构,完成10类手写体数据集的分类问题。实验原理首先提取手写体的特征,训练集为28*28的手写体图片,将手写体图片等分为7*7份,每一份的大小为4*4,统计每份中非0像素(即手写体)的个数n,像素占有率大于T(设为0.05)取特征值1,否则取特征值0。对于要识别的手写体,首先提取特征值,然后计算09类的后验概率,后验概率最大即为对应类别实验内容%手写体特征值提取函数function sample_feature=feature_extraction(sample)%单个样品的行数,单个样品的列数,训练集的个数image_row,image_col,sample_num=size(sa
14、mple);sample_feature=zeros(49,sample_num);%存储训练集的特征yuzhi=0.05;%窗口面积比阈值%提取训练集的特征for k=1:sample_num p=1; for i=1:4:image_row-3 for j=1:4:image_col-3 for m=i:i+3 for n=j:j+3 if (sample(m,n,k)=0) %统计手写体中每个窗口中非零像素的个数 sample_feature(p,k)=sample_feature(p,k)+1; end end end %面积占有率大于yuzhi取特征值为1 if ( (sample_
15、feature(p,k)/16)yuzhi ) sample_feature(p,k)=1; else sample_feature(p,k)=0; end p=p+1; end endend主函数load mnistAll;%提取样品库每个手写体的特征train_feature=feature_extraction(mnist.train_images);train_num=60000;%训练集大小%求09手写数字的特征分布pw=zeros(1,10);%先验概率pxw=zeros(49,10);%训练集的类条件概率for k=1:train_num i=mnist.train_labels
16、(k)+1; %统计每类的样品个数 pw(i)=pw(i)+1; %统计每类的每个特征特征值为1的个数 pxw(:,i)=pxw(:,i)+train_feature(:,k);endfor i=1:10 %求每类的特征分布概率 pxw(:,i)=(pxw(:,i)+1)/(pw(i)+2);endpw=pw/train_num;pwx=zeros(1,10);%后验概率test_feature=feature_extraction(mnist.test_images);test_num=10000;%测试样品个数true_num=0;for k=1:test_num pxw_test=zer
17、os(1,10)+1;%测试样品的类条件概率 for i=1:10 %求测试样品的类条件概率 for j=1:49 if(test_feature(j,k)=1) pxw_test(i)=pxw_test(i)*pxw(j,i); else pxw_test(i)=pxw_test(i)*(1-pxw(j,i); end end end for i=1:10 %测试样品的后验概率的分子 pwx(i)=pw(i)*pxw_test(i); end maxval maxpos=max(pwx); y=maxpos-1; if ( y=mnist.test_labels(k) true_num=tr
18、ue_num+1; endend识别结果10000个测试样品中正确识别了6891个,正确率为68.91%实验四基于Fisher准则的线性分类器设计一、实验目的本实验旨在让同学进一步了解分类器的设计概念,能够根据自己的设计对线性分类器有更深刻地认识,理解Fisher准则方法确定最佳线性分界面方法的原理。二、实验原理线性判别函数的一般形式可表示成 其中 根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为: 上面的公式是使用Fisher准则求最佳法线向量的解,该式比较重要。另外,该式这种形式的运算,我
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 实验 报告 20
限制150内