2023年模式识别第二次上机实验报告.docx
《2023年模式识别第二次上机实验报告.docx》由会员分享,可在线阅读,更多相关《2023年模式识别第二次上机实验报告.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京科技大学计算机与通信工程学院模式分类第二次上机实验报告姓名:X XXXXX学号:0 0 000000班级:电信11时间:2 0 23-04-16一、实验目的1 .掌握支持向量机(SVM)的原理、核函数类型选择以及核参数选择原则等;二、实验内容2 .准备好数据,一方面要把数据转换成Libsvm软件包规定的数据格式为:la b e 1 i nde x 1 : v a luel index2:value 2 .其中对于分类来说1 abe 1为类标记,指定数据的种类;对于回归来说label为目的值。(我重要要用 到回归)Ind e x是从1开始的自然数,va 1 ue是每一维的特性值。该过程可以自
2、己使用excel或者编写程序来完毕,也可以使用网络上的F onnatD a taL i bs v m. x 1 s来完毕。FormatD a t a Libsvm.x 1 s 使用说明:先将数据按照卜.列格式存放(注意label放最后面):val u el v alue 21 a belval u el value 2 lab e 1然后将以上数据粘贴到FormaiDalaLibs v m.xl s中的最左上角单元格,接着工具一宏执行行 FormatDataToL i bsvm宏。就可以得到lib s vin规定的数据格式。将该数据存放到文本文献中进行 下一步的解决。3 .对数据进行归一化。该
3、过程要用到1 i b svm软件包中的s v msea 1 e .ex eS v msc a le 用法:用法:svmsc a le - 1 1 ower u u p p e r -y y_lower y_uppc r -s s a v e_ f il e name -r re store _fil e n a me f i I e n a m e (缺省值: 1 o wer = 1, upper = 1,没有对 y 进行 缩放) 其中,-1:数据卜限标记;lower:缩放后数据下限;-u:数据上限标记;u ppc亡缩放后数据上限; 一 y:是否对目的值同时进行缩放;y_l ower为下限值,
4、y_up p er为上限值;(回归需要对目的进行缩 放,因此该参数可以设定为-y 11 ) -s save_fil e n a me:表达将缩放的规则保存为文献sa v e _f i I e name; -r re s t ore_f i lename:表达将缩放规则文献 r e store_filen a m e 载入后按此缩 放;f ilen a me:待缩放的数据文献(规定满足前面所述的格式)。缩放规则文献可以用文本浏览器打开,看到其格式为:ylower u p per mi n m a x xlower u p p eri n dex 1 mini max 1index 2 niin2
5、 max 2其中的lower与upper与使用时所设立的lower与u p per含义相同;in dex表 示特性序 号;min转换前该特性的最小值;max转换前该特性的最大值。数据集的缩放结果在此情况下通过 DOS窗口输此当然也可以通过DOS的文献重:定向符号”/将结果另存为指定的文献。该文件中的 参数可用于最后面对目的值的反归化。反归一化的公式为:(Vai ue_ 1 ow e r)*(max -mi n ) /(upp e r -1 o wer)+ 1 owe r其中value为归一化后的值,其他参数与前面介绍的相同。建议将训练数据集与测试数据集放在同一个文本文献中一起归一化,然后再将归
6、一化结果提成训练 集和测试集。4 .训练数据,生成模型。用法: svm t rain opli o ns (raini n g_ s e t_ f ile mod e其中,opti。ns(操作参数):可用的选项即表达的涵义如下所示-ssvm类型:设立SVM类型,默认值 为0,可选类型有(对于回归只能选3或4):0 - C-SV C 1 - n -SVC 2 - one-clas s - S VM 3 - e -SVR4 一 n - SVR -t核函数类型:设立核函数类型,默认值为2,可选类型有:0 -线性核:u,*vl -多项式核:(g- u* v + c o e f O)de g re e
7、2 RBF 核:e( u v 2) g - 3 s i gmoid 核:tan h (g*u,* v + coef 0) d d e g re e :核函数中的d e gree设立,默认值为3;g g :设立核函数中的g ,默认值为1/k ;-rcoefO:设立核函数中的co e f 0,默认值为0; c cos t:设立C- SVC、e SVR、n6-SVR中从处罚系数C,默认值为l;-n n:设立n- SVC、one class-SVM与n-SVR 中参数n ,默认值0.5;- pe :设立n - SVR的损失函数中的e,默认值为0.1;m c a c hesize:设立c a che内存
8、大小,以MB为单位,默认值为40; -e e:设立终止准则中的可 容忍偏差,默认值为0.00 1; -h shrinking:是否使用启发式,可选值为0或I.默认值为l;-b概 率估计:是否计算SVC或SVR的概率估计,可选值0或1,默认0;-wi weight:对各类样本的处罚 系数C加权,默认值为1; -v n: n折交叉验证模式。其中一g选项中的k是指输入数据中的属性数。操作参数-v随机地将数据剖分为n部分并计算 交叉检查准确度和均方根误差。以上这些参数设立可以按照SVM的类型和核函数所支持的参数进 行任意组合,假如设立的参数在函数或SVM类型中没有也不会产生影响,程序不会接受该参数;
9、假如应有的参数设立不对的,参数将采用默认值。t r a in i ng_sct_filc是要进行训练的数据 集;mode 1 .file是训练结束后产生的模型文献,该参数假如不设立将采用默认的文献名,也可以设立成自己惯 用的文献名。本实验中的参数一s取3, -t取2 (默认)还需拟定的参数是-c,-g,- p另,实验中所需调整的重要参数是-c和-g,-c和-g的调整除了自己根据经验试之外,还可以使用 g ridrc g rcssion.py对这两个参数进行优化。(需要补充)该优化过程需要用到PythonQ. 5),G n uplot (4. 2), gri d reg r e ssio n .
10、 py(该文献需要修改途 径)。然后在命令行下面运营:p ython. e x e gridreg r ess i on. py - 1 og2c -10,10, 1 -log2g 10, 10,1 -io g 2 p 10,10, 1 -s 3 -t 2 -v 5 - s vmtrai nE :1 i bsvmlibsvm-2.86wi n dow s s v m-tra i n .exe-g nuplol E : 1 i b svmMib s vm-2.86gn u p 1 otbin p g n u plo t .e x e E: 1 ibsvmM i bs v m- 2 .86w i
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 模式识别 第二次 上机 实验 报告
限制150内