《大数据技术原理与操作应用》习题解答(二).docx





《《大数据技术原理与操作应用》习题解答(二).docx》由会员分享,可在线阅读,更多相关《《大数据技术原理与操作应用》习题解答(二).docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术原理与操作应用习题解答(二)第三章一、单项选择题1、以下选项中,假设是哪个节点关闭了,就无法访问Hadoop集群()。 A、 namenode B、 datanode C、 secondary namenode D yarn参考答案:A2、以下说法中,关于客户端从HDFS中读取数据的说法错误的选项是()。 A、客户端会选取排序靠前的DataNode来依次读取Block块 B、客户端会把最终读取出来所有的Block块合并成一个完整的最终文件 C、客户端会选取排序靠后的DataNode来依读取Block块 D、如果客户端本身就是DataNode,那么将从本地直接获取数据参考答案:C3、以
2、下选项中,用于检验数据完整性的信息的是()o A、心跳机制 B、ACK机制 C、选举机制 D、垃圾回收机制参考答案:B4、以下选项中,关于HDFS说法错误的选项是()o A、HDFS是Hadoop的核心之一五、简答题 1、简述单点故障的产生。参考答案:当存储数据块的服务器中突然有一台机器宕机,我们就无法正常的获取文 件了,这个问题被称为单点故障2、简述HDFS的优点和缺点。参考答案:HDFS分布式文件系统具有优点和缺点。优点有高容错、流式数据访问、支 持超大文件、高数据吞吐量以及可构建在廉价的机器上;缺点有高延迟、不适合小文 件存取场景以及不适合并发写入。3、简述Fslmage镜像文件和Edi
3、tLog日志文件。参考答案:Fslmage镜像文件用于存储整个文件系统命名空间的信息,EditLog日志文 件用于持久化记录文件系统元数据发生的变化。答案解析:Fslmage镜像文件用于存储整个文件系统命名空间的信息,EditLog日志文 件用于持久化记录文件系统元数据发生的变化。4、简述NameNode管理分布式文件系统的命名空间。参考答案:在NameNode内部是以元数据的形式,维护着两个文件,分别是Fslmage镜 像文件和EditLog日志文件。其中,Fslmage镜像文件用于存储整个文件系统命名空间 的信息,EditLog日志文件用于持久化记录文件系统元数据发生的变化。当NameNo
4、de 启动的时候,Fslmage镜像文件就会被加载到内存中,然后对内存里的数据执行记录的 操作,以确保内存所保存的数据处于最新的状态,这样就加快了元数据的读取和更新 操作。答案解析:在NameNode内部是以元数据的形式,维护着两个文件,分别是Fslmage镜 像文件和EditLog日志文件。其中,Fslmage镜像文件用于存储整个文件系统命名空间 的信息,EditLog日志文件用于持久化记录文件系统元数据发生的变化。当NameNode 启动的时候,Fslmage镜像文件就会被加载到内存中,然后对内存里的数据执行记录的 操作,以确保内存所保存的数据处于最新的状态,这样就加快了元数据的读取和更新
5、 操作。5、简述HDFS中提供了 Secondary NameNode节点的职责。参考答案:Secondary NameNode节点主要是周期性的把NameNode中的EditLog日志 文件合并到Fslmage镜像文件中,从而减小EditLog日志文件的大小,缩短集群重启 时间,并且也保证了 HDFS系统的完整性。答案解析:Secondary NameNode节点主要是周期性的把NameNode中的EditLog日志 文件合并到Fslmage镜像文件中,从而减小EditLog日志文件的大小,缩短集群重启 时间,并且也保证了 HDFS系统的完整性。6、简述HDFS读数据的原理。参考答案:(1)
6、客户端向NameNode发起RPC请求,来获取请求文件Block数据块所 在的位置。(2) NameNode检测元数据文件,会视情况返回Block块信息或者全部 Block块信息,对于每个Block块,NameNode都会返回含有该Block副本的DataNode 地址。(3)客户端会选取排序靠前的DataNode来依次读取Block块(如果客户端本 身就是DataNode,那么将从本地直接获取数据),每一个Block都会进行CheckSum(完整性验证),假设文件不完整,那么客户端会继续向NameNode获取下一批的Block列 表,直到验证读取出来文件是完整的,那么Block读取完毕。(4
7、)客户端会把最终读 取出来所有的Block块合并成一个完整的最终文件 B HDFS 源于 Google 的 GFS 论文 C、HDFS用于存储海量大数据 D、HDFS是用于计算海量大数据 参考答案:D5、以下选项中,用于存放部署Hadoop集群服务器的是()。 A、 namenode B、 datanode C、 rack D、 metadata参考答案:c答案解析:Rack是用来存放部署Hadoop集群服务器的机架。6、以下选项中,用于删除HDFS上文件夹的方法是()o A、delete () B、rename () C、mkdirs () D copyToLocalFile()参考答案:A
8、答案解析:FileSystem对象调用delete。方法可以删除文件夹,delete()方法接收两 个参数,第一个参数表示要删除的文件夹路径,第二个参数用于设置是否递归删除目 录。7、以下选项中,关于HDFS的架构说法正确的选项是()。 A、HDFS采用的是主备架构 B、HDFS采用的是主从架构 C、HDFS采用的是从备架构 D、以上说法均错误参考答案:B答案解析:HDFS采用主从架构(Master/Slave架构)。8、以下选项中,用于上传文件的Shell命令是()o A、 -1s B、 -mv C -cp D、 -put参考答案:D二、多项选择题1、以下选项中,关于数据块说法正确的选项是O
9、 O A、磁盘进行数据读/写的最大单位 B、磁盘进行数据读/写的最小单位 C、数据块是抽象的块 D、DataNode是按block对数据进行存储。参考答案:B, C,D2、以下说法中,关于crontab表达式说法正确的选项是()。 A、通过执行crontab表达式可以执行定时任务 B、crontab表达式是由6个参数决定 C、Crontab表达式是由5个参数决定 D、以上说法均正确参考答案:A,B3、以下说法中,关于使用Java API操作HDFS说法正确的选项是()。 A、需要引入hadoop-common依赖 B、需要引入hadoop-hdfs依赖 C、需要引入hadoop-client依
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术原理与操作应用 数据 技术 原理 操作 应用 习题 解答

限制150内