iris数据集的贝叶斯分类(共9页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《iris数据集的贝叶斯分类(共9页).doc》由会员分享,可在线阅读,更多相关《iris数据集的贝叶斯分类(共9页).doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上IRIS数据集的Bayes分类实验一、 实验原理1) 概述模式识别中的分类问题是根据对象特征的观察值将对象分到某个类别中去。统计决策理论是处理模式分类问题的基本理论之一,它对模式分析和分类器的设计有着实际的指导意义。贝叶斯(Bayes)决策理论方法是统计模式识别的一个基本方法,用这个方法进行分类时需要具备以下条件: 各类别总体的分布情况是已知的。 要决策分类的类别数是一定的。其基本思想是:以Bayes公式为基础,利用测量到的对象特征配合必要的先验信息,求出各种可能决策情况(分类情况)的后验概率,选取后验概率最大的,或者决策风险最小的决策方式(分类方式)作为决策(分类)
2、的结果。也就是说选取最有可能使得对象具有现在所测得特性的那种假设,作为判别的结果。常用的Bayes判别决策准则有最大后验概率准则(MAP),极大似然比准则(ML),最小风险Bayes准则,Neyman-Pearson准则(N-P)等。2) 分类器的设计对于一个一般的c类分类问题,其分类空间:表特性的向量为:其判别函数有以下几种等价形式:a) , b)c)d)3) IRIS数据分类实验的设计 IRIS数据集:一共具有三组数据,每一组都是一个单独的类别,每组有50个数据,每个数据都是一个四维向量。其分类空间为:表特性的向量为: 实验目的:利用Bayes判别准则对三组数据进行分类,希望能够尽量准确的
3、判断出从IRIS数据集中选取的样本所属的类别。 实验设计思路:将每个数据看作是一个具有4维特征的观察样本假设每类数据的每维都的分别服从正态分布即并且两两独立。由数理统计理论可知,样本均值和修正方差分别为和的无偏估计量,故可近似为求得和为:贝叶斯决策规则选取:由于不同维度数据两两独立,故其中:另让门限值:其中:和为所选待分类样本j类数据和i类的个数,属于先验知识。比较与门限值的大小判断样本所属类别最后计算分类的正确率二、 实验过程1) 求取每类数据的每个分量的均值和修正方差数代码如下:sum=zeros(3,4);sd=zeros(3,4);for j=1:1:4for i=1:1:50$ fo
4、r i=1:1:20 $ sum(1,j)=sum(1,j)+sample1(i,j); sum(2,j)=sum(2,j)+sample2(i,j); sum(3,j)=sum(3,j)+sample3(i,j);endendsum=sum/50; $sum=sum/20;$for j=1:1:4for i=1:1:50 sd(1,j)=sd(1,j)+(sample1(i,j)-sum(1,j)2; sd(2,j)=sd(2,j)+(sample2(i,j)-sum(2,j)2; sd(3,j)=sd(3,j)+(sample3(i,j)-sum(3,j)2;endendsd=sd/49;
5、$ sd=sd/19; $其中每类数据都有4组均值和修正方差,3类数据总共12组,分别存放在sum 和sd这两个34的矩阵中。2) 用一个函数来实现分类器的功能,代码如下function clfresult,accuracyrate = bayesclassifier(samples,dimen,sum,sd,mode1,mode2)clfresult=zeros(dimen,2);if (mode1(1,1)=0)&(mode1(1,2)=0)&(mode1(1,3)=0) compare=1,2;endif (mode1(1,1)=0)&(mode1(1,2)=0)&(mode1(1,3)
6、=0) compare=1,3;endif (mode1(1,1)=0)&(mode1(1,2)=0)&(mode1(1,3)=0) compare=2,3;endcompare1=compare(1,1);compare2=compare(1,2);class=zeros(1,3);la=zeros(1,4);lb=zeros(1,4);for i=1:1:dimenif samples(i,5)=1 class(1,1)=class(1,1)+1;endif samples(i,5)=2 class(1,2)=class(1,2)+1; endif samples(i,5)=3 class
7、(1,3)=class(1,3)+1;endendn=class(1,compare2)/class(1,compare1)for i=1:1:dimenla(1,1)=1/sqrt(sd(compare1,1)*exp(-(samples(i,1)-sum(compare1,1)2/(2*sd(compare1,1);la(1,2)=1/sqrt(sd(compare1,2)*exp(-(samples(i,2)-sum(compare1,2)2/(2*sd(compare1,2);la(1,3)=1/sqrt(sd(compare1,3)*exp(-(samples(i,3)-sum(co
8、mpare1,3)2/(2*sd(compare1,3);la(1,4)=1/sqrt(sd(compare1,4)*exp(-(samples(i,4)-sum(compare1,4)2/(2*sd(compare1,4);lb(1,1)=1/sqrt(sd(compare2,1)*exp(-(samples(i,1)-sum(compare2,1)2/(2*sd(compare2,1);lb(1,2)=1/sqrt(sd(compare2,2)*exp(-(samples(i,2)-sum(compare2,2)2/(2*sd(compare2,2);lb(1,3)=1/sqrt(sd(c
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- iris 数据 贝叶斯 分类
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内