《大数据平台搭建与配置管理》期中试题试卷及答案.docx
《《大数据平台搭建与配置管理》期中试题试卷及答案.docx》由会员分享,可在线阅读,更多相关《《大数据平台搭建与配置管理》期中试题试卷及答案.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据平台搭建与配置管理大数据平台搭建与配置管理期中试题期中试题(闭卷A)题 号一二三四五六七八九十成绩满 分30202030100得 分【本套试卷共有4大题,计66小题】一、选择题(20题,每题1.5分,共30分)1、Client端上传文件的时候下列正确的是()。A. 数据经过NameNode传给DataNodeB.Client只上传数据到一台DataNodeC. Client端将文件切分为Block,依次上传D.NameNode负责Block复制工作2、HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成一下文
2、件()。A. 日志B. 命名空间镜像C. 两者都是D.以上都不是3、MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是?()A. 实现Writable接口的类是值B. 实现WritableComparable接口的类可以是值或键C. Hadoop的基本类型Text并不实现WritableComparable接口D. 键和值的数据类型可以超出Hadoop自身支持的基本类型4、对MapReduce的体系结构,以下说法不正确的是()A. 分布式编程架构B. 以数据为中心,更看重吞吐率C. 分而治之的思想D. 将一个任务
3、合并成多个子任务5、在创建Linux分区时,一定要创建()两个分区。A. FAT/NTFSB. FAT/SWAPC. NTFS/SWAPD. SWAP/根分区6、下面哪个命令是用来定义shell的全局变量()。A. exportfsB. aliasC. exportsD. export7、ZooKeeper可以实现()。A. 高吞吐量和低延迟数量B. 高吞吐量和高延迟数量C. 低吞吐量和低延迟数量D. 低吞吐量和高延迟数量8、分布式应用正在运行的一组系统称为()。A. 集群B. 分布式系统C. 单元D. 组9、查询速度的提升是以额外的()为代价的。A. 创建索引B. 创建索引和存储索引C. 删
4、除索引D. 存储索引10、Hive的元数据不能够存储在哪些位置?()A. mysqlB. derbyC. oracleD. 文本文件11、HBase依赖()提供消息通信机制。A. ZookeeperB. ChubbyC. RPCD. Socket12、LSM含义是?()A. 日志结构合并树B. 二叉树C. 平衡二叉树D. 长平衡二叉树13、HFile数据格式中的Data字段用于()。A. 存储实际的KeyValue数据B. 存储数据的起点C. 指定字段的长度D. 存储数据块的起点14、下列不属于Stream Grouping方式的是()。A. ShuffleGroupingB. AllGrou
5、pingC. FieldsGroupingD. newGrouping15、Storm会在集群内分配对应并行度个数的()来同时执行这一组件。A.哈希值B. ThriftC. task线程D. Worker进程16、Storm可以用来实时处理新数据和()。A. 删除数据库B. 更新数据库C. 删除节点D. 更新表17、MapReduce编程模型,键值对的key必须实现哪个接口?()。A. WritableComparableB. ComparableC. WritableD. LongWritable18、HBase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率()。A. R
6、OOT-表 B. .META.表C. HFile indexD. 普通的数据块19、HBase的Region组成中,必须要有以下哪一项()。A. StoreFileB. MemStoreC. MetaStoreD. HFile 20、设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作()。A. 分桶 B. 分区C. 索引D. 分表二、填空题(20题,每题1分,共10分)21、Spouts会从外部读取流数据并持续发出 。22、当Spout或者Bolt发送元组时,它会把元组发送到每个订阅了该 的Bolt上进行处理。23、Storm采用了 来作为分布式协调组件。
7、24、HBase分布式模式最好需要 个节点。25、LSM结构的数据首先存储在 。26、HBase 中 Hmaster 负责监控 的生命周期。27、Hive远程服务通过 方式访问Hive。28、Hive不支持 的更新。29、Hive非常适合于对那些只在文本末尾添加数据的大型数据集进行 。30、分布式应用程序可以基于Zookeeper实现诸如数据发布/订阅、 、命名服务、分布式协调/通知、 、 、分布式锁和分布式队列等功能。31、注册成临时节点后,再服务端出问题时,节点会自动的从zookeeper上 。32、ZooKeeper提供了一项基本服务是 。33、计算过程高度抽象到两个函数 和 。34、每
8、一个小数据都可以完全 地进行处理。35、大规模数据集的处理包括 两个核心环节。36、ResourceManager默认的WebUI访问端口号为: 。37、Hadoop集群搭建中常用的4个配置文件为: 、hdfs-site.xml、mapred-site.xml、 。38、HA产生的背景是 。39、网络管理两个重要任务分别是: 和 。40、 命令是删除文件命令。三、判断题,正确填“T”,错误填“F”(20题,每题1分,共20分)41、Hadoop 支持数据的随机读写()。42、NameNode 负责管理元数据信息metadata,client 端每次读写请求,它都会从磁盘中读取或会写入 meta
9、data 信息并反馈给 client 端()。43、MapReduce 的 input split 一定是一个 block()。44、链式MapReduce计算中,对任意一个MapReduce作业,Map和Reduce阶段可以有无限个Mapper,但Reducer只能有一个()。45、HBase对于空(NULL)的列,不需要占用存储空间。()。46、MapReduce适于PB级别以上的海量数据在线处理()。47、MapReduce计算过程中,相同的key默认会被发送到同一个reduce task处理()。48、HBase可以有列,可以没有列族(column family)()。49、/tmp目
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据平台搭建与配置管理 数据 平台 搭建 配置管理 期中 试题 试卷 答案
限制150内