Spark编程基础及项目实践章节练习题项目8+答案.docx
《Spark编程基础及项目实践章节练习题项目8+答案.docx》由会员分享,可在线阅读,更多相关《Spark编程基础及项目实践章节练习题项目8+答案.docx(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、习题81.选择题(1)按照任务划分,下列不是机器学习模型的是( D )A. 回归模型B. 分类模型C. 结构化学习模型D. 结构化统计模型(2)下列不是MLlib数据类型的是( D )。A. 本地向量B. 标记向量C. 本地矩阵D. 向量矩阵(3)如果想把一列特征进行数值化,使得相应的特征索引化要使用什么方法( A )。A. StringIndexerB. IndexToStringC. StandardScalerD. VectorIndexer(4)下面哪个不是MLlib的特征选择方法( B )。A. VectoerSlicerB. KafSelectorC. RformulaD. Chi
2、SqSelector(5)在特征提取过程中,通过计数方法将一组文本文档转换为向量使用什么方法( D )。A. CountCentorizerB. StringIndexerC. StringVectorD. Tokenizer2.操作题 使用Hadoop用户名登录Linux系统,启动Spark-shell,使用Hadoop提供的Shell完成如下操作:(1)下载数据集https:/archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data,该数据集为鸢尾花数据统计,然后对这些数据集进行统计工作:数据数量、每一列最大值、最小值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Spark 编程 基础 项目 实践 章节 练习题 答案
限制150内