南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据开发技术(一)》在线作业二.docx
南开大学23春学期(高起本:1709-2103,专升本/高起专:1903-2103) 大数据开发技术(一)在线作业关于Storm中Topology说法错误的是0。选项A: Topology可视为流转换图选项B: Topology可以被提交到Storm集群执行选项C:在Topology里面可以指定每个组件的并行度,Storm会在集群里面分配那么多的线程来同时计算选项D: Topology里面的每一个组件都是串行运行的参考答案:D1. Leaflet是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:B2. Google Chart API是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:A3. Weka是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:D选项A: Zookeeper服务器选项B:客户端选项C: Master服务器选项D: Region服务器参考答案:A,B,C,DHadoop配置文件中说法错误的是()o选项A:core-site, xml中hadoop. tmp. dir表示存放临时数据的目录,仅为NameNode的数据选项B: core-site, xml中fs. defaultFS表示HDFS路径的逻辑名称选项 C: hdfs-site. xml 中 dfs. namenode. name. dir 表示存储fsimage文件的地方选项D: hdfs-site. xml中dfs. replication表示副本的数量,伪 分布式要设置为0选项 E: hdfs-site. xml 中 dfs. datanode. data, dir 表示 HDFS 数据存放block的地方参考答案:A,C40. HDFS只允许一个文件有一个写入者,不允许多个用户对同一个文件执行写操作选项A:对选项B:错参考答案:AStorm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何 操作。选项A:对选项B:错参考答案:AHbase 中每个 Region 使用一个 Hlog选项A:对选项B:错参考答案:BHbase和传统数据库一样都是列式数据库选项A:对选项B:错参考答案:BMapReduce和Spark都属于大数据批处理计算的产品。选项A:对选项B:错参考答案:AYahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还 要解决实时数据获取、传输、存储选项A:对选项B:错参考答案:BHDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的 完整性。选项A:对选项B:错参考答案:A"hadoop dfs"和"hdfs dfs"两条命令都只是用于HDFS文件系统 选项A:对选项B:错参考答案:A41. 大数据开发的两大核心技术是Hadoop和MapReduce选项A:对选项B:错参考答案:B42. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯 一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量 等选项A:对选项B:错参考答案:A5. Hbase中Zookeeper文件记录了()的位置选项A: .META.表选项B: -ROOT-表选项 C: Region选项 D: Master参考答案:B6. 优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数 据库是()选项A:列族数据库选项B:键值数据库选项C:图数据库选项D:文档数据库参考答案:A7. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻 辑层选项 A: Client Layer选项 B: Services Layer选项 C: Platform Layer选项 D: Infrastructure Layer参考答案:B8. NoSQL中的CAP理论中的P代表()选项A: 一致性选项B:可用性选项C:分区容忍性选项D:可扩展性参考答案:C9. UMP系统中面对分库分表用户如何进行资源调度()选项A:可以共享同一个MySQL实例选项B:每个用户独占一个MySQL实例选项C:会占用多个独立的MySQL实例选项D:随机分配MySQL实例参考答案:C信息技术发展史上的第三次信息化浪潮解决的问题是什么0。选项A:信息处理选项B:信息增长选项C:信息爆炸选项D:信息传输参考答案:Chadoop fs -()命令可以将指定的文件的内容输出到标准输出选项A: cat选项 B: append选项C: add选项 D: write参考答案:AHadoop中执行MapReduce任务不含哪种方式()。选项 A: Mahout选项 B: Hadoop jar选项C: Shell脚本选项 D: Python参考答案:A应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()选项A:列族数据库选项B:键值数据库选项C:图数据库选项D:文档数据库参考答案:BEcharts是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:AMapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。选项 A: Split选项B: Slot选项C: Map选项 D: Shuffle参考答案:B优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()选项A:列族数据库选项B:键值数据库选项C:图数据库选项D:文档数据库参考答案:BUMP系统借助于()来实现高效和可靠的协同工作选项 A: Mnesia选项B: LVS选项 C: RabbitMQ选项 D: Zookeeper参考答案:D对于不同顶点之间的信息交换,Pregel采用了()选项A:远程数据读取选项B:共享内存选项C:纯消息传递模型选项D:共享消息参考答案:CHbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访 问过的()位置信息,用来加快后续数据访问过程选项 A: Master选项 B: Slaver选项 C: Region选项D:客户端参考答案:C流数据采取()计算模式选项A:批量选项B:实时选项C:大数据选项D:动态参考答案:B应用于存储、索引并管理面向文档的数据或者类似的半结构化数据, 比如,用于后台具有大量读写操作的网站的数据库是哪种()选项A:列族数据库选项B:键值数据库选项C:图数据库选项D:文档数据库参考答案:DAmazon RDS 属于()选项A:关系数据库选项B:键值数据库选项C: NoSQL数据库选项D:数据仓库参考答案:A优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()选项A:列族数据库选项B:键值数据库选项C:图数据库选项D:文档数据库参考答案:C10. Hbase中采用()保证系统出错时及时恢复选项 A: MemStore选项B: Hlog选项 C: StoreFile选项D:客户端参考答案:B11. Google Cloud SQL是谷歌公司推出的基于()的云数据库选项 A: MySQL选项 B: SQL Server选项 C: Hbase选项 D: Oracle参考答案:A12. 针对流数据,“量子恒道”开发了海量数据实时流计算框架0。选项 A: Time Tunnel选项 B: Spark选项 C: Super Mario选项 D: Storm参考答案:CHDFS中当一些数据节点不可用时,会导致一些数据块的副本数量() 冗余因子选项A:大于选项B:小于选项C:等于选项D:大于等于参考答案:BNoSQL中的CAP理论中的A代表0选项A: 一致性选项B:可用性选项C:分区容忍性选项D:可扩展性参考答案:BPregel计算模型以()作为输入选项A:有向图选项B:无向图选项C:矢量图选项D:树参考答案:AHBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算 机集群处理由超过10亿行数据和数百万列元素组成的数据表选项A:垂直扩展选项B:水平扩展选项C:拓扑扩展选项D:叠加参考答案:B以下哪些是云计算关键技术()。选项A:虚拟化选项B:分布式计算选项C:分布式存储选项D:物联网选项E:单租户参考答案:A,B,C以下哪种数据库适合于小批量的数据处理0选项 A: MySQL选项 B: Oracle选项 C: Hbase选项 D: NosSQL参考答案:A,BHDFS要实现的目标选项A:流数据读写选项B:大数据集的操作选项C:复杂的文件模型选项D:强大的跨平台兼容性参考答案:A,B,D以下哪个是HDFS的局限性()。选项A:延迟高选项B:只允许对文件执行追加操作,不能执行随机写操作选项C:用MapReduce处理大量小文件时,会产生过多的Map任务, 线程管理开销会大大增加选项D:拥有复杂的数据模型参考答案:A,B,CHbase 中 Zookeeper 提供 了()选项A:分布式同步选项B:组服务选项C:域名服务选项D:配置维护参考答案:A,B,C,D以下属于Hadoop的安装方式的有()。选项A:单机模式选项B:多机模式选项C:分布式模式选项D:并行模式选项E:伪分布式模式参考答案:ACE关系数据库与NoSQL数据库相比有哪些优势()选项A:支持事务ACID四性选项B:可以支持超大规模数据存储选项C:以完善的关系代数理论作为基础选项D:具有强大的横向扩展能力参考答案:A,C以下亚马逊的产品中哪个属于计算部分选项A: EC2选项B: EBS选项C: S3选项D: ELB参考答案:A,DHbase系统结构中包括()