人工智能导论 习题答案(吕云翔)章节习题(第6章).docx
-
资源ID:60548465
资源大小:44.31KB
全文页数:4页
- 资源格式: DOCX
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
人工智能导论 习题答案(吕云翔)章节习题(第6章).docx
人工智能导论习题答案机器学习章节习题习题选择题. Logistics regression和一般回归分析有什么区别?A. Logistics regression可以用来预测事件可能性的Logistics regression可以用来度量模型拟合程度B. Logistics regression可以用来估计回归系数D.以上所有1 .想在大数据集上训练决策树,为了减少训练时间,可以:A.增加树的深度B.增加学习率(learning rate)C.减少树的深度D.减少树的数量.以下说法正确的选项是:A. 一个机器学习模型,如果有较高准确率,说明这个分类器一定是好的B.如果增加模型复杂度,那么模型的测试错误率总是会降低C.如果增加模型复杂度,那么模型的训练错误率通常是会降低的D.不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别 进行学习.如果SVM模型欠拟合,以下方法哪些可以改进模型:A.增大惩罚参数C的值B.减小惩罚参数C的值C.减小核系数(gamma参数).当模型的bias高时,我们如何降低它?A.在特征空间中减少特征B.在特征空间中增加特征C.增加数据点.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题A增加训练集量B减少神经网络隐藏层节点数C删除稀疏的特征SD SVM算法中使用高斯核/RBF核代替线性核.关于SVM泛化误差描述正确的选项是A、超平面与支持向量之间距离B、SVM对未知数据的预测能力C、SVM的误差阈值.如果使用数据集的全部特征并旦能够到达100%的准确率,但在测试集上仅能 到达7()%左右,这说明:A、欠拟合B、模型很棒C、过拟合. 一般来说,以下哪种方法常用来预测连续独立变量?A.线性回归B.逻辑回顾C.线性回归和逻辑回归都行D.以上说法都不对10.下面三张图展示了对同一训练样本(散点),使用不同的模型拟合的效果(曲 线)。那么,我们可以得出哪些结论(多项选择)?A.第1个模型的训练误差大于第2个、第3个模型B.最好的模型是第3个,因为它的训练误差最小C.第2个模型最为“健壮”,因为它对未知样本的拟合效果最好D.第3个模型发生了过拟合E.所有模型的表现都一样,因为我们并没有看到测试数据判断题1 .训练一个支持向量机,除去非支持向量后仍能分类;2 .在线性可分的情况下,支持向量是那些最接近决策平面的数据点;3 .构建一个最简单的线性回归模型需要2个系数(只有一个特征);4 .知道变量的均值(Mean)和中值(Median),即可以计算到变量的偏斜 度(Skewness);5 . Logislics regression回归的RELU函数将输出概率限定在0,1之间。6 .k折交叉验中的k值并不是越大越好,k值过大,会降低运算速度;7 .回归模型中存在多重共线性(multicollinearity)的问题,可以通过剔除 所有的共线的变量来解决此问题;8 .评估训练后的模型,发现模型存在高偏差,可以通过增加模型的特征的数 量来解决此问题;9 .点击率预测是一个正负样本不平衡问题(例如99%的没有点击,只有1 %点击)。假如在这个非平衡的数据集上建立一个模型,得到训练样本的正 确率是99%o那么,此时模型正确率并不高,应该建立更好的模型。10.回归和分类问题都可能发生过拟合。答案:选择题1. D2. C3. C4. A5. B6. D7. B8. C9. A10. ABC判断题LT2 .T3 .T4 . F5 . F6 .T7 . F8 .T9 .T10 . T