1+x大数据试题库及答案.docx
《1+x大数据试题库及答案.docx》由会员分享,可在线阅读,更多相关《1+x大数据试题库及答案.docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1+x大数据试题库及答案一、单选题(共90题,每题1分,共90分)1、名称节点(NameNode)是HDFS的管理者,它的职责有3个方面,下 面哪个选项不是NamdeNode的职责?()A、负责保存数据块B、负责管理和维护HDFS的命名空间(NameSpace)C、接收客户端的请求D、管理DataNode上的数据块(Block)正确答案:A2、Sqoop的底层实现是()?A、 HDFSB、 HbaseC、 MapReduceD、 Hadoop正确答案:c3、下面哪个程序负责HDFS数据存储?()A、 tasktrackerB NameNodeC、 JobtrackerD、 secondaryN
2、ameNodeE Datanode正确答案:E4、对于HDFS文件读取过程,描述不正确的是?()A、通过对数据流反复调用read(.方法,把数据从数据节点传输到客户端B HDFS客户端通过Configuration对象的open(.方法打开要读取的文 件C、当客户端读取完数据时,调用FSDatalnputStream对象的close(.方 法关闭输入流D、DistributedFileSystem负责向远程的名称节点(NameNode)发起 RPC调用,得到文件的数据块信息,返回数据块列表正确答案:B5、大数据分析平台的实施流程顺序是()。A与甲方确定总体计划B组 建项目团队C部署环境准备D应
3、用集成及数据集成E系统安装和调试A、 BACEDB ifup teamOC、 nmcli con shD、 nmcli dev正确答案:A49、下面哪个不属于YARN的架构的组成部分?()A、 ResourceManagerB、 Application MasterC、 JobTrackerD NodeManager正确答案:c50、建立在Hadoop文件系统之上的分布式的列式数据库?()A、 MahoutB、 HiveC、 YARND HBase正确答案:D51、关于培训的总体目标、定制培训课程和内容和培训形式,以下说法 正确的是()。A、系统使用人员的培训目的是使其可以独立完成大数据 平台
4、的日常维 护,解决一般问题。B、培训过程中将针对不同的用户和不同的培训内容采用相同的培训方 案,以达到最佳的培训效果。C、培训形式包括集中培训、现场培训、针对性培训。D、实践培训主要针对于技术开发人员及系统维护和客户。正确答案:C52、日志消息的级别中哪个是比较严重的情况()A、CRITB、ERRC、 DEBUGD、 ALEKKT正确答案:A53、HDFS 默认 Block Size 的大小是()。A、 64MBB、 128MBC、 32MBD、256M正确答案:B54、Hadoop的生态系统组件之一 Sqoop的功能是?A、负责集群资源调度管理的组件B、用来在Hadoop和关系数据库之间的交
5、换数据,改进数据的互操作性C、提供高可靠性、高可用、分布式的海量日志采集D、用来存储非结构化和半结构化的松散数据正确答案:B55、关于Sqoop数据的导入导出描述不正确的是?()A、实现从HDFS到Oracle的导入导出B、实现从MySQL到Oracle的导入导出C、实现从MySQL到Hive的导入导出D、实现从HDFS到MySQL的导入导出正确答案:B56、大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行 采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的 ()A、新一代信息技术和服务业态B、新一代服务业态C、新一代信息技术D、新一代技术平台正确答案:A57、下面哪个选
6、项不属于DataNode的职责?()A、启动DataNode线程,向NameNode定期汇报数据块信息B、定期向NameNode发送心跳信息保持联系C、保存数据块D、管理数据块正确答案:D58、Sqoop的底层实现是?()A、 HBaseB、 HDFSC、 HadoopD、 MapReduce正确答案:D59、Hadoop的配置目录在哪里?()A、 $HAD00P_H0ME/confB、 $HAD00P_H0ME/etc/hadoopC /etc/hadoopD、 /etc/hosts正确答案:B60、YARN哪种调度器采用的是单队列?()A、以上都不是B、 Capacity Schedule
7、rC、 FIFO SchedulerD Fair Scheduler正确答案:C61、在Centos7系统中,查看和修改IP信息需要用到()文件A、/etc/resolv. confB /etc/sysconfig/network-script/ifcfg-ensOC、/etc/sysconfig/network/ifcfg-ensOD、 /etc/sysconfig /ifcfg-ensO正确答案:B62、多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率? ()A、 Fair SchedulerB Capacity SchedulerC、 FIFO SchedulerD、以上都
8、不是正确答案:B63、Hadoop的安装部署的模式属于伪分布模式()A、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的 生产环境。B、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个 JVM上执行。C、高容错全分布模式的守护进程运行在多台主机搭建的集群上D、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运 行,模拟集群环境,并且是相互独立的Java进程。正确答案:D64、使用java-api访问hdfs时,数据块副本数由下面那个决定?()A、 secondarynodeB、 namenodeC、 datanodeD、 client正确答案:D65
9、、关于HDFS回收站描述正确的是?()A、HDFS为每一个用户都创建了回收站,这个类似操作系统的回收站。位 置是/user/用户名/. Trash/B、用户不能手动清空回收站中的内容C、HDFS回收站默认开启D、HDFS回收站中的文件文件像Windows回收站一样,如果不清空回收站, 文件会一直保留在回收站。正确答案:A66、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具 有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务 是:()A、多次写入,多次读写B、一次写入,少次读写C、多次写入,少次读写D、一次写入,多次读写正确答案:D67、大数据的特点不包括下面哪一项(
10、)oA、增长速度快B、巨大的数据量C、价值密度高D、多结构化数据正确答案:C68、对Sqoop描述不正确的是?()A、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理B、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关 系型数据库。C、Sqoop的底层实现是MapReduceD、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案:B69、当NameNode出错时,下面哪个方案描述正确,且是最佳故障恢复和 容错方案?()A、多增加 DataNodeB、采用 SecondaryName 定时备份 NameNode 的 fsimage 和 edits
11、C、采用 NameNode Fedaration,多个 Namenode一起工作。D采用NameNode HA,当一个NameNode出错时,另一个NameNode接管它 的工作。正确答案:D70、以前在传统数据库与Hadoop之间,数据传输没有专门的工具,两者 数据的互导是比较困难的,的出现解决了这个问题?()A、 SqoopB、 HiveC、 FlumeD、 Zookeeper正确答案:A71、下面哪个目录保存了 Hadoop集群的命令(比如启动Hadoop) ?()A、 shareB sbinC etcD bin正确答案:B72、HDFS是基于流数据模式访问和处理超大文件的需求而开发的,
12、具有 高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是 ()oA、多次写入,少次读B、一次写入,少次读C、多次写入,多次读D、一次写入,多次读正确答案:D73、用于检查节点自身的健康状态的进程是()A、 NameNodeB、 ResourceManagerC DataNodeD、 NodeManager正确答案:D74、下列是关于flume和sqoop对比的描述,不正确的是。A、flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数据B、flume和sqoop都是分布式处理任务C、flume主要用来采集日志而sqoop主要用来做数据迁移D、flume主要采集流式数据而
13、sqoop主要用来迁移规范化数据正确答案:B75、以下选项哪个可以修改文件或目录的访问权限()A、suB、 passwdC、 useraddD、 chmod正确答案:D76、在ZooKeeper中有三种角色,下列选项中不属于ZooKeeper中的角 色()A、 LeaderB、 ObserverC FollowerD、 Obeyer正确答案:D77、整个大数据平台按其职能划分为五个模块层次,运行环境层是()A、运行环境层为基础设施层提供运行时环境,它由2部分构成,即操 作系统和运行时环境。B、基础设施层由2部分组成:Zookeeper集群和Hadoop集群。它为 基础平台层提供基础设施服务C、
14、基础平台层由3个部分组成:任务调度控制台、HBase和Hive。它 为用户网关层提供基础服务调用接口。D、用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认 证,是用户唯一可见的大数据平台操作入口。正确答案:A78、日志消息的级别中那个是不会影响系统但值得注意()A、CRITB、 ALEKKTC、 DEBUGD、 NOTICE正确答案:D79 HBase分布式模式最好需要()个节点A、1B、4C、3D、2正确答案:C80、大数据解决方案确认需求分析准备工作不包括()A、编制确定客户实施计划B、根据事先了解的初步用户需求,列出这些难点C、和客户负责人沟通,确定客户需求小组成员D、充分了
15、解客户的要求,客户的业务,客户的关注重点正确答案:A81、以下选项哪个命令可以查看主机信息()A、 ifup teamOB、 nmcli con shC teamdctl teamO stD、 nmcli dev正确答案:D82、2006年,Google公司发表了用来处理海量数据的一种非关系型数据 库的论文是?()A、 “Bigtable: A Distributed Storage System for Structured Data”B、 uMapReduce: Simplified Data Processing on Large Clusters”C、 “The Hadoop File
16、 System”D、 “The Google File System”正确答案:A83、Hadoop的安装部署的模式属于本地模式()A、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的 生产环境。B、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运 行,模拟集群环境,并且是相互独立的Java进程。C、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个 JVM上执行。D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案:C84、下面哪个YARN的描述不正确的是?()A、YARN 指 Yet Another Resource Negotiat
17、or,是另一种资源协调者B、YARN只支持MapReduce 一种分布式计算模式C、YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了 巨大好处D、YARN最初是为了改善MapReduce的实现正确答案:B85、Hadoop官方真正支持的操作系统是()A、 WindowsB、 LinuxC、 UNIXD、DOS正确答案:B86下列不属于NameNode的功能()。A、保存Block信息,汇报Block信息B、保存metadata信息C、提供名称查询服务D、metadata信息在启动后会加载到内存正确答案:A87、Sqoop的作用是()A、是一个建立在HDFS之上,面向列的针对结构
18、化和半结构化数据的动 态数据库B、用于传统关系型数据库和Hadoop之间传输数据C、提供对日志数据进行简单处理的能力D、是Hadoop体系中数据存储管理的基础正确答案:B88、报告hdfs使用情况采用()命令A、 hdfsdfsadmin-clrSpaceQuota/user/testnameB、 hdfsdfsadmin-setSpaceQuota500g /path/xxx/C、 hdfsdfsadmin-reportD、 hdfs dfs -getfacl /user/testname正确答案:C89、哪个不是HDFS默认Block SizeA、 64MBB、128MB旧版本用64M当前
19、新版本用128MC、 32MB正确答案:C90、从Vi编辑模式下保存配置返回到Centos7系统使用A、按“Esc”键,然后按“shift” + “: ”组合B、按“Esc”键,然后按“shift + “: ”,输入wq回车C、直接输入“exit”D、按 “shift” + “: ” 组合正确答案:B二、多选题(共20题,每题1分,共20分)1、HDFS只设置一个名称节点带来的局限性包括()A、集群的可用性B、命名空间的限制C、隔离问题D、性能的瓶颈正确答案:ABCD2、ZooKeeper角色选举角色包括()A、客户端(client)B、跟随者(follower)C、观察者(observer)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 试题库 答案
限制150内