《人工智能基础与应用》第4章课后习题参考答案.docx

资源ID：91008999 资源大小：39.13KB 全文页数：5页
资源格式： DOCX 下载积分：5金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要5金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

《人工智能基础与应用》第4章课后习题参考答案.docx

第4章分门别类：帮你分而治之课后习题答案一、考考你1.关于正负样本的说法正确是 D 。A.样本数量多的那一类是正样本B.样本数量少的那一类是负样本C.正负样本没有明确的定义D.想要正确识别的那一类为正样本2.分类器实质为一个 A ，把样本的特征集X映射到一个预先定义的类标号y。A.模式B.函数C.映射D.转换3.用计算概率来解决分类问题是哪种分类器 C 。A.决策树B.最近邻C.贝叶斯D.支持向量机4.识别手写数字过程中，对图片进行灰度化处理的主要原因是 C 。A.方便转为文本格式B.尽可能保存全部图片信息C.较少计算量，同时尽可能保存图片信息D.有利于提高分类效果5.SVM的最优分界面是由 A 决定的。A.支持向量B.所有样本C.多数样本D少数样本二、亮一亮1.最近邻分类器与支持向量机各自分类的基本思想是什么？参考答案：最近邻分类器的基本思想：找到与待分类的样本最相似的k个邻居，这k个邻居中多数邻居属于哪一类，那么就指定该样本属于哪一类。即我们把每个具有n个特征的样本看作n维空间的一个点，对于给定的新样本，先计算该点与其它样本点的距离(相似度)，然后将新样本指派为周围k个最近邻的多数类。该分类思想源于这样的常识：判别一个人是好人还是坏人，可以从跟他走得最近的k个人来判断，如果k个人中多数是好人，那么可以指派他为好人，否则他是坏人。支持向量机分类器的基本思想：通过非线性映射，把无法在低维样本空间分类的问题映射到一个高维的特征空间，在高维空间通过一个线性超平面而非低维空间的直线将样本完全划分开。2.在案例1的手写数字识别过程中，个别样本出现错分的现象，主要原因是什么？参考答案：个别样本出现错分主要原因有：（1）因训练样本数据规模不够造成分类模型学习不够，导致不能有效应对各种样本的分类；（2）样本质量不高时也会影响模型识别的正确率。三、帮帮我1.尝试改用SVM方法来识别手写数字，建议核函数使用rbf，其它模型参数自己设定，对比SVM模型的识别效果与案例1的差异，并分析原因。参考答案：#数字图片信息转存为txt文件import osfrom PIL import Imageimport numpy as npimport pandas as pdimport sklearn.model_selection as ms# 定义图片到文本的转换函数def imgtotext(imgfile,txtfile,size=(32,32): #imgfile待识别图像，txtfile将图像转换为txt文件输出，size图像大小，默认32*32 image_file = Image.open(imgfile) image_file = image_file.resize(size,Image.LANCZOS) image_file=image_file.convert('L') width,height = image_file.size f =open(txtfile,'w') ascii_char = '10' for i in range(height): pix_char='' for j in range(width): pixel = image_file.getpixel(j,i) pix_char+=ascii_charint(pixel/128) pix_char+='n' f.write(pix_char)f.close()#将图片转换成文本信息imgtotext(r'data3.jpg',r'data3_0.txt') #定义函数，将文本数据转换成数字形式的数组def txt2array(filename): X=np.zeros(1,1024) f = open(filename) for i in range(32): lineStr = f.readline() for j in range(32): X0,32*i+j = int(lineStrj)return X#将文件夹下所的文件转换成数组和对应的标签def convert2dataset(file_path): list_file=os.listdir(file_path) m=len(list_file) datas=np.zeros(m,1024) labels= for i in range(m): num=int(list_filei0) labels.append(num) datasi,:=txt2array(file_path+''+list_filei) return datas,labels# 生成训练样本集和测试样本集x_train,y_train=convert2dataset(r'datatrainingDigits')x_test,y_test=convert2dataset(r'datatestDigits')#构建并训练SVM模型import sklearn.svm as svmmodle=svm.SVC(C=1, kernel='rbf')modle.fit(x_train,y_train)print(modle.score(x_train,y_train)运行结果：#测试模型效果import sklearn.metrics as smy_pred=modle.predict(x_test)print(sm.classification_report(y_test,y_pred)运行结果：从以上结果可知，基于svm的分类器预测，平均精确率为99%，优于案例1的knn分类器，原因是对于数字这种转为文本后特征值较多的分类场景，svm相对有优势。2.尝试使用KNN方法辅助诊断乳腺癌，注意调整合适的K值，比较该方法与案例2方法在诊断效果上谁优谁劣，并分析原因。参考答案：#homwork-02# 准备训练集和测试集import numpy as npimport pandas as pdimport sklearn.model_selection as msdatas=pd.read_csv(r'datawisc_bc_data.csv',sep=',')x=datas.iloc:,2:32y=datas.iloc:,1:2x_train,x_test,y_train,y_test=ms.train_test_split(x,y,test_size=0.2, random_state=42)y_train=y_train.values.ravel()y_test=y_test.values.ravel()'''构建和训练模型'''import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsClassifierimport pandas as pd# 构建knn模型knn= KNeighborsClassifier(n_neighbors=43,weights='distance',p=2)#训练KNN模型knn.fit(x_train,y_train)knn.score(x_train,y_train)# 评估模型效果from sklearn.metrics import classification_reporty_pred=knn.predict(x_test)print(classification_report(y_test,y_pred)运行效果：从运行结果可知，基于knn模型的分类器分类效果弱于svm分类模型，主要的原因是knn本质上是少数服从多数的原则，预测结果有时受k取值的影响，而对于样本特征值较多的场合，svm更具有优势。

注意事项

本文（《人工智能基础与应用》第4章课后习题参考答案.docx）为本站会员（暗伤）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

《人工智能基础与应用》第4章 课后习题参考答案.docx

《人工智能基础与应用》第4章 课后习题参考答案.docx

《人工智能基础与应用》第4章课后习题参考答案.docx

《人工智能基础与应用》第4章课后习题参考答案.docx