用身高与体重数据进行性别分类的实验报告175719.docx
《用身高与体重数据进行性别分类的实验报告175719.docx》由会员分享,可在线阅读,更多相关《用身高与体重数据进行性别分类的实验报告175719.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、用身高和体体重数据进进行性别分分类的实验验报告姓 名:刘刘懿郴 学学 号:2200933023008 范 英 学学 号: 200993023316 胡 亮 学学 号: 200993023319 班班 级:939111、 基本要求 用FAMAALE.TTXT和MALEE.TXTT的数据作为训训练样本集集,建立BBayess分类器,用用测试样本本数据对该该分类器进进行测试。调调整特征、分分类器等方方面的一些些因素,考考察它们对对分类器性性能的影响响,从而加加深对所学学内容的理理解和感性性认识。2、具体做做法 (1)应用用两个特征征进行实验验:同时采采用身高和和体重数据据作为特征征,分别假假设二者相
2、相关或不相相关,在正正态分布假假设下估计计概率密度度,建立最最小错误率率Bayees分类器器,写出得得到的决策策规则,将将该分类器器应用到训训练/测试试样本,考考察训练/测试错误误情况。比比较相关假假设和不相相关假设下下结果的差差异。在分分类器设计计时可以考考察采用不不同先验概概率(如00.5 vvs. 00.5, 0.755 vs. 0.225, 00.9 vvs. 00.1等)进进行实验,考考察对决策策和错误率率的影响。 (2) 自行给出一一个决策表表,采用最最小风险的的Bayees决策重重复上面的的实验。3、实验原原理 已知样本本服从正态态分布, (11)所以可以用用最大似然然估计来估估
3、计和两个参数数 样本类分为为男生和女女生两类,利利用最大似似然估计分分别估计出出男生样本本的,和女生生样本的,然后将数数据带入(11)公式分分别计算两两者的类条条 件概率密密度和,然后根根据贝叶斯斯公式计算出两类类的后验概概率和实验一:对对于两类情情况,我们们可以仅定定义一个判判别函数: 其中 = = 并将决策规规则表示为为 如果 0,则决决策; 0,则则决策; 0? 输入数据样本集带入判别函数 N Y 实实验流程图4、实验结结果 利利用mattlab我我们计算出出了malle.txxt和femmale.txt的的均值和协协方差,和,这样我们们可以利用用公式和判判别函数与与决策规则则对训练/测
4、试样本本集进行分分类,结果果如下:(1) 当体重和身身高相关的的时候 对对于tesst1测试试集,总体体来说,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)先先增大后减减小,而对对于男性或或者女性的的的个体判判别随着男男性的先验验概率的增增加而正确确率不断增增加或不断断减小(也也就是随着着男性先 验验概率的增增加,将男男性判断为为女性的概概率越来越越少,甚至至没有;而而把女性判判别为男性性的概率越越来越大)而对于于testt1测试集集,对样本本集的判断断正确率随随着男性的的先验概率率的增加(女女性先验概概率的减少少)而不断断增加,而而对于男性性或者女性性的的
5、个体体判别随着着男性的先先验概率的的增加而正正确率不断断增加或不不断减小(也也就是随着着男性先验验概率的增增加,将男男性判断为为女性的概概率越来越越大;而把把女性判别别为男性的的概率越来来越小)(2)当体体重和身高高不相关的的时候 对于teest1测测试集,总总体来说,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)先先增大后减减小,而对对于男性或或者女性的的的个体判判别随着男男性的先验验概率的增增加而正确确率不断增增加或不断断减小(也也就是随着着男性先验验概率的增增加,将男男性判断为为女性的概概率越来越越少,甚至至没有;而而把女性判判别为男性性的概率越越来越
6、大)而而对于teest1测测试集,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)而而不断增加加,而对于于男性或者者女性的的的个体判别别随着男性性的先验概概率的增加加而正确率率不断增加加或不断减减小(也就就是随着男男性先验概概率的增加加,将男性性判断为女女性的概率率越来越大大;而把女女性判别为为男性的概概率越来越越小)(3)当体体重和身高高相关的时时候 对对于tesst1测试试集,总体体来说,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)先先增大后减减小,而对对于男性或或者女性的的的个体判判别随着男男性的先验验概率的增增加而
7、正确确率不断增增加或不断断减小(也也就是随着着男性先 验验概率的增增加,将男男性判断为为女性的概概率越来越越少,甚至至没有;而而把女性判判别为男性性的概率越越来越大)而而对于teest1测测试集,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)而不断增加,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(4)当体体重和身高高不相关的的时候 对对于testt1测试集集,总体来来说,对样样本集的判判断正确率率随着男性性的先验概概率的增加
8、加(女性先先验概率的的减少)先先增大后减减小,而对对于男性或或者女性的的的个体判判别随着男男性的先验验概率的增增加而正确确率不断增增加或不断断减小(也也就是随着着男性先 验验概率的增增加,将男男性判断为为女性的概概率越来越越少,甚至至没有;而而把女性判判别为男性性的概率越越来越大)而而对于teest1测测试集,对对样本集的的判断正确确率随着男男性的先验验概率的增增加(女性性先验概率率的减少)而而不断增加加,而对于于男性或者者女性的的的个体判别别随着男性性的先验概概率的增加加而正确率率不断增加加或不断减减小(也就就是随着男男性先验概概率的增加加,将男性性判断为女女性的概率率越来越大大;而把女女性
9、判别为为男性的概概率越来越越小)。5.结果总总体分析由实验结果果可知,对对测试集的的测试数据据表明,最最小错误率率的贝叶斯斯分类器在在假设两特特征相关的的情况下,男男生类与女女生类的先先验概率与与事实越接接近既各为为0.5时时其准确率率越高,当当男生的先先验概率大大于女生时时,容易将将女生误判判为男生,当当男生的先先验概率小小于女生时时,容易将将男生误判判为女生,在在假设两特特征不相关关时分类器器对先验概概率依赖较较小且准确确率较高。而对样本集集的测试数数据则表明明女生先验验概率大于于男生时分分类器的准准确率较高高,假设两两类特征不不相关时其其准确率变变化不大,但但女生先验验概率较大大时对男生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 身高 体重 数据 进行 性别 分类 实验 报告 175719
限制150内