欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2023年用身高与体重数据进行性别分类的实验报告.docx

    • 资源ID:86683101       资源大小:32.45KB        全文页数:10页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2023年用身高与体重数据进行性别分类的实验报告.docx

    用身高和体重数据进行性别分类的实验报告姓名:刘懿郴 学号:范英学号:胡亮 学号:班级:93 9 11、基本规定用F AM A L E. TXT和MALE. TXT的数据作为训练样本集,建立Baye s分类器, 用测试样本数据对该分类器进行测试。调整特性、分类器等方面的一些因素, 考察它们对分类器性能的影响,从而加深对所学内容的理解和感性结识。2、具体做法(1)应用两个特性进行实验:同时采用身高和体重数据作为特性,分别假设两者相 关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayeserr o rl2for n =1 : 5 0a = HW 2(:, n);u 1 1= 1 73. 92 0 0; 6 5 .5020; t heg emal 1 = 20.7536 23. 0 58 2 ; 23.05 8 2 59. 8 982;%ADEuul2=162. 8 400; 5 2 .5960 ;thg ema 12=(4 3.93 4 4 1 5 .525 4 ;15.52 5 4 31. 12 8 5 ;%A®Eud e t 1 l=det(the g em a 11);detl2=det(thgemal2);p( 1 1) = 1 / ( (2*pi) * (d e t llA0.5) ) *exp(-l / 2 * ( (a-u 1 1 ) / /thegem a 11)* (a-ull);P (12)=l/( (2*pi)*(detl 2 - 0.5) *e xp(-l/2* ( (a-u 1 2) ,/thgemal2) * (a- u 1 2 );pz=p (11) *pw 1+p ( 1 2 ) *p w2;pll= (p (11) * p wl ) /p z ; %ma 1 e°6e ,p 1 2= (p (12 ) *pw2 ) / p z ;1 e06NeJAAEg= p 11-p 1 2 ; %t e s I 2Q05 0 4oiafemalei f (g<0)1 ef e male 2 = f em a 1 e2+ 1 ;e Iseerror2 1 =error 2 1+ 1 ; en d e ndfem a 1 e2er r o r 2 1fo r n=5 1 : n u mber2a = HW2 ( : ,n);u 1 1=1 7 3.9 2 00;65.5020: t h e gemall= 20.7536 2 3 . 0 5 82: 23 . 0 58259.8982;%ADuu 1 2 = 1 62.8400; 52. 5 960; thgem a 12=43. 9 344 15.5254;1 5.5254 3 1 .12 8 5;%A®Eud e tll=det (t h e g email) ;detl2=det ( t h g ema 12):p (ll)=l/(2*pi)*(det 1 1 A0.5) ) *exp(-l/ 2 * ( ( a - u*/thegemall)*(a -ul 1 );p (1 2 )=1 / ( (2* p i) * (det 12 人 0. 5) ) *exp(-l / 2* ( (a- u 12) ' /thge m a 1 2 ) * ( a -ul2);P z= P (11) *pw 1 + p (12) * p w 2 ;p 11= (p (11) * pw 1 ) / p z; %ma 1 自,AA£p 1 2= (p (1 2 ) *pw2) /pz;e 06Ne , AAEg = p 11- p 12; %test 2 Q050 , bt afem a 1 e1 f (g>0) %AD<HiEQ2»EQmal emale 2 =male2 + l;elsee r r o r22= err or22+ 1 ;e ndendm a le2err o r 2 2(2)当身高与体重不相关ull=l 7 3. 9200; 65.50 2 0 ; t h egem a 1 1=(20. 7 5 36 0 ; 0 5 9.8 9 82ul2= 1 6 2.84 0 0: 5 2. 596 0 ;thgemal2= 4 3. 934 40; 0 31. 12 85 : %A®Eud e t ll=de t ( t he g e m a 1 1 );d e t 1 2 =det (thg e mal 2 );进行替代 u 11= 1 7 3 .9200; 65. 5 0 20 ; t hegemal 1 = 2 0 .75 3 6 23. 0582;2 3 .0582 59.8 982 ;%A£)Euul2=l 62.840 0;52.59 60;thgema 12=(43. 9344 15. 5254;1 5 .52 5 43 1 . 1 2 8 5 即可(3) (4)基本都类似有源程序代码可以直接运营即可分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练 /测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5vs. 0. 5, 0. 75 vs. 0. 2 5 , 0. 9vs.0.1等)进行实验,考察对决策和错误率的影响。(2)自行给出一个决策表,采用最小风险的Bayes决策反复上面的实验。3、实验原理已知样本服从正态分布,1 p(x) =-T-T-exp(1)(1)(2兀产|婷所以可以用最大似然估计来估计U和2两个参数样本类分为男生吗和女生两类,运用最大似然估计分别估计出男生样本 的汽, 4,和女生样本的2/2,然后将数据带入(1 )公式分别计算两者的类条件概率密度P(*l 1%)和P(*2 1做),然后根据贝叶斯公式I P(%包)P(3j)P | X)=(/叫万(吗) 1=1计算出两类的后验概率P31和P® 1%) 实验一:对于两类情况,我们可以仅定义一个判别函数:。(%)=-2(%)-。1(外其中 3(“= pm/x)=JP3)£p(x/&)P(例)/=|g2(x)"5/x)=华?2 P(为&)p(?)/=1并将决策规则表达为假如g (x)>0,贝映策归;g (x)<0,则决策必。实验二:我们定义一个决策表如下图2损失态%06%20R(%k) =2P®gj = iR(%l*) = A21P(W1IX)我们定义判别函数(x) = R(a1|x)- R(a2|x)并将决策规则表达为假如g (力>0,则决策归;g(x)<0,则决策必。蛤、粮田口*在带入判别函数g(,t)实验流程图(173.9200) 协方差 M =165.5020,4、实验结果运用m a tlab我们计算出了 m a le. t x t和fem a le. tx t的均值和l f20.7536 23.058211nL,=和1 (23.0582 59.8982(162.8400十 (43.9344 15.52541、52.5960/2一(15.5254 31.1285,这样我们可以运用公式和判别函数与决策规则对训练/测试样本集进行分类,结果如下:(1)当体重和身高相关的时候先验概率先验概率testltest2男性pw女性pw男性判断正I男性判断错女性判断11女性判断与正确率错误率男性判断11男性判断与女性判断正女性判断正确率错i:0.10.90. 10. 61319715115080%20%1539702.90%21139491 67. 30% 32491 86. 70% 13一:)5aOO24S66420W292O.9对于testl测试集,总体来说,对样本集的判断对的率随着男性的先验概率 的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判 别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先 验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为 男性的概率越来越大)而对于testl测试集,对样本集的判断对的率随着男性的先 验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的个 体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男 性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的概 率越来越小)(2)当体重和身高不相关的时候先验概率testltest2男性PW妁tpw男性判断口男性判断错女性判断改性判骷正确率错误率男性判断i男性判断以性判断及性判断正确率错误0.1 0.9173150 91.40% 8.60$19357491 80.70% 19.0.4 0.6200150 100%0%21733491 80.70% 11.0.5 0.5200141 97.10% 2.90$22327482 90. X 9.0.6 0.4200141 97.10% 2.90%22624482 91.30% 8.0.9 0.1200123 91.40% 8.60%2428428 94.70% 5.对于test 1测试集,总体来说,对样本集的判断对的率随着男性的先验概 率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判 别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先 验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为 男性的概率越来越大)而对于t es t I测试集,对样本集的判断对的率随着男性的 先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的 个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着 男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的 概率越来越小)(3)当体重和身高相关的时候先验概率testltest2男性叫女性pw男性判断男性判断女性判断女性判用正确率错误率男性判由男性判H女性判N女性判的正确率错误率0.10.91010150#28.60%11413650045.30%0.40.6155150#14.30%17476491#25.70%0.50.515515014.30%1915949180%20%0.60.4192141«#8.60%20446491糊聃15.70%0.90.1200123#8.60%2428446糊聃4. 70%对于test 1测试集,总体来说,对样本集的判断对的率随着男性的先验 概率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个 体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于te s tl测试集,对样本集的判断对的 率随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或 者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小 (也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性 判别为男性的概率越来越小)(4)当体重和身高不相关的时候先验概率testltest2男性pw女性叫男性判断j男性判断毛女性判断j女性判断彳正确率错误率男性判断口男性判断彳女性判航女性判断正确率错误率0.10.913715080%20%15694500 68.70%31%0.40.6182150 94.30%5.70%20545491 84.70% 15.30%0.50.5191150 97.10%2.90%2064449185%15%0.60.4191150 97.10%2.90%21040491 86.30% 13.70%0.90.1200141 97.10%2.90%23515464 93.70% 6.30%对于te s tl测试集,总体来说,对样本集的判断对的率随着男性的先验概 率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体 判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性 先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于lestl测试集,对样本集的判断对的率 随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或 者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小 (也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性 判别为男性的概率越来越小)。5 .结果总体分析由实验结果可知,对测试集的测试数据表白,最小错误率的贝叶斯分类器在 假设两特性相关的情况下,男生类与女生类的先验概率与事实越接近既各为0. 5时其准确率越高,当男生的先验概率大于女生时,容易将女生误判为男生,当男 生的先验概率小于女生时,容易将男生误判为女生,在假设两特性不相关时分类 器对先验概率依赖较小且准确率较高。而对样本集的测试数据则表白女生先验概率大于男生时分类器的准确率较 高,假设两类特性不相关时其准确率变化不大,但女生先验概率较大时对男生的误 判较多,男生的先验概率较大时对女生的误判较多。最小风险的贝叶斯分类器假设两类特性相关时,男生类与女生类的先验概率 与事实接近既各为0.5时其准确率较高,由于男生误判为女生的损失较大,所以男 生的先验概率越大则将女生误判为男生的概率越高,准确率则较低,女生的先验概 率较高时分类器准确率较高,假设两类特性相关时,情况与不相关时类似,说明最 小风险的贝叶斯分类器对先验概率依赖限度较高而对特性之间是否互相独立关 系不大。此外,对样本集的分类测试对的率明显低于测试集,分析认为是由于样本分 布并不十分近似正态分布,且数据分布比较分散,而测试集的数据却恰好较严格 服从正态分布且数据分布比较集中。6 .实验心得通过实验更加深刻地理解了贝叶斯分类器的设计过程以及模式辨认的流程,通过实验了 解了所学知识的实用价值,明白了最大似然估计,最小错误率的贝叶斯分类器与最小风险的 贝叶斯分类器的优缺陷与合用情况,通过讨论解决实验中碰到的问题.明白了书中的公式不 止需要记忆,还需要理解,明白了团队分工协作的重要性。7 .相关实验代码(1)当体重和身高相关的最小错误率分类期代码clear all;pwl=input ( 1 ADfiupAIEie , AAE£o * )pw2= input- A®EupAIENe , AaE£o/ )m a le 1 = 0 ; fema 1 el = 0; e r r o rll = 0: err o rl 2 = 0 ;male2=0; f emal e 2 = 0;err o r 21= 0 ;er r o r22=0;%2aEONu±tlH t 1 W =te x tre a d (' E : z 6EyIAR§JEUA£EESI±dA£EE±dEpNet e s t 1. t x t »%f %f %*sf);t2H t 2 W= t extre a d ( ' E: 6Eyi AN§£UA£EEc±dA£EEc±5EpNe tes t 2. t x t', '%f %f %*sz );HW 1 = t 1 H t 1 W ;HW1 = HW1'HW2= t2H t 2W ;HW2 = HW21 ;numbe r l=len g th (HW1) ;% % % %tes t 1 (15,20) pA.dEynumbe r 2=1 e n g th(HW2) ;e st2 ( 5 0 , 250) pAidEyf or n =1: 20a =HW1 (: , n);u 1 1= 1 73.920 0 ;65. 5 0 20 : thegem a 1 1 =2 0 . 7 5 3 6 2 3 .0582;23.05 8 2 5 9.8 9 82 ;%ADEuu 1 2 = 1 6 2 ,8400;52.596 0 ; t h gemal2= 4 3.93 4 4 15. 5 25 4 ;15. 525431.12 8 5; %AEudet 1 l=det(th e g e mall) ;det12=det (thgemal2);p (11) =1/ ( (2*pi) * (de t 1 lA0.5) ) *exp-l/2* ( (a-u 1 1) '/thegema 1 1 ) * (a-u 11);p ( 1 2)=1/ ( (2*pi ) * (det 1 2八0.5) ) *exp ( 1 /2* ( (a-ul2) 1 /thgemal2) * (a-u 12);p z=p (1 1 ) *pw 1 + p (12) * pw 2 ;p 1 1= (p ( 1 1)* pwl)/pz;pl2=(p(l 2 ) *p w2) /pz;g= p ll-pl2:i f (g> 0 ) %Nu±-Q0 1 54dEEEQADEu ma 1 e 1 =m a lel + 1;els eer r o r 1 l=e r ro r 11 + 1;e ndendm a leierr o rl 1for n = 21: numberla=HW 1 (:,n):ull=173.9200; 65.5020: the g e mall= 20. 7 536 23.058 2 ;23.05 8 2 5 9. 89 8 2 ;%ADEuul 2 = 162. 8400; 5 2.5 960 : th g emal2=43.9344 15.52 54; 15.5254 31.1285 ;%A®Eude t ll=det (thegemall) ; d e t 1 2=de t ( t hg e mal 2 );P (ll)=l/(2*pi) *(detllA0.5)*exp(-l/2* ( (a-ul 1 ) , / the g e mall) * (a ull);p(l 2 )=1/( ( 2 *p i ) * (detl 2 人 0.5) )*exp (- 1 /2* (a-ul 2 ) '/thg e mal2) * (a-u 12);p z=p (11) *pwl+ p (12) * p w2;P 1 1= (p ( 1 1) *pw 1 ) / pz;p 1 2 = (p (1 2 ) * p w2) / P z;g= p 1 1 -pl2;if ( g<0) %Ru±-testl06 2 0 . bEQf e malefem a lel=fem a 1 e 1 + 1;elseer r o r 12= c rrorl2+ 1 ;en den df ema1e1

    注意事项

    本文(2023年用身高与体重数据进行性别分类的实验报告.docx)为本站会员(太**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开