《虚拟化与云计算模拟试卷.doc》由会员分享,可在线阅读,更多相关《虚拟化与云计算模拟试卷.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、?虚拟化与云计算?模拟试卷姓名: 学号: 院系: 第一局部:选择题共40分,每题4分1) Reducer的三个阶段是A. ShuffleSortReduceB. ShuffleReduceSortC.ReduceShuffleSortD.SortShuffleReduce2) 以下关于mapreduce的key/value对的说法正确的选项是A. 输入键值对不需要与输出键值对类型一致B. 输入的key类型必须与输出的key类型一致C. 输入的value类型必须与输出的value类型一致D. 输入键值对只能映射成一个输出键值对3) 下面哪一个选项是mapreduce真正的引擎A. Namenod
2、eB. DatanodeC. Job Tracker and Task TrackerD. HDFS4) 以下选项中哪个不是GFS中“Masters的主要功能A.维护所有文件系统的元数据B.周期性地与chunkservers联系来发送指令与检查状态C.对于读与写,客户端通过与Master联系来获得chunk的位置,然后直接与chunkservers连接D. 返回最终的答案给客户端5) 以下哪个选项不是我们需要Hive的主要原因A.我们需要一个容量为PB级别的数据仓库。B.文件是不充分的数据抽象。C.Hadoop在处理作业方面是不够的。D.我们需要一个开发的数据格式。6) 下面那个不是云计算的特
3、征A.虚拟化B.动态可扩展C.管理多设备D.个体自治7) Hadoop用来确保数据准确性的方法不包括下面的哪一个A.使用校验与来验证数据B.客户端每512字节计算一次校验与,数据节点存储这些校验与C.客户端从数据节点中检索数据,如果验证失败,客户尝试别的副本D.数据节点中的数据被加密以防止可能的攻击8) 关于分布式文件系统的说法,不正确的选项是A .分布式文件系统整个集群中有多个namespaceB .文件被分为大的块,通常为128MC.可以通过Java、C或者命令行访问D.非常适合对大文件的流式读取9) 以下错误不是Hadoop能很好解决的A.任务失败B.任务追踪失败C.连接失败D.作业追踪
4、失败10) 以下哪个选项能正确地在Hive中返回 “查询年龄在18到25岁之间的用户返回的前5页的结果A.SELECT p.url, COUNT(1) as clicksFROM users u JOIN page_views p ON (u.name = p.user)WHERE u.age = 18 AND u.age = 18 AND u.age = 18 AND u.age = 25ORDER BY clicks;第二局部:简答题共60分,第一大题10分,第二大题20分,第三大题30分一、简述MapReduce的主要思想与工作原理可借助下面的例子,并根据例子画出数据流图例子:使用Map
5、Reduce解决求商品价格最小问题,输入为商品名称、商品价格、商品网站,输出为商品名称、最小价格、商品网站。输入样例:CCloud computingVirtualization and cloud computing VVirtualization and cloud computing 36.6 360buy C输出样例:CVirtualization and cloud computing 30.8 bookschina 二、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请答复关于分布式文件系统的以下问题:(1).在设计分布式
6、文件系统时需要注意哪些方面?(2).原先存储超大文件的分布式文件系统现用来存储大规模小文件,如何对文件系统进展调整使其针对现在文件的特点发挥更好的性能?(3).分布式文件系统保证数据不被丧失通常存在多个副本并存储在不同的机器上,当用户对数据进展修改时系统存在两种方案:完成一个副本的修改并给用户响应,之后待系统空闲时完成其它副本的修改;完成所有副本的修改之后给用户响应。请说明两种方案的优劣,并做出你的选择并说明选择原因或者你有更好的方案?。三、在社会计算与移动计算迅猛开展的潮流下涌现了许多著名的互联网公司,假设你与你的朋友也准备参加创业大潮中,建立自己的企业。现假设你们公司的主要业务是移动设备的
7、互联网信息搜索与挖掘,如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价,拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信息,当然你们已经设计了比拟好的图形匹配算法及搜索算法,并方案使用云计算来进展处理,根据以上背景答复下面问题:(1).你们公司需要构建数据中心现在由你来负责,根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些?(2).在数据中心中使用虚拟化技术是必须的,请说说如何部署、管理虚拟化解决方案?你又如何使用商业公司的现有虚拟化产品?(3).受经济危机的影响以及公司盈利能力的不确定性,风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了,你需要将业务创立在云计算平台上,a). 与建立自己的数据中心相比,使用商业公司的云计算平台有什么优点与缺点?b). 云构架的根本层次有哪些?并给出给出各个层次的实例。谈谈你如何在云计算平台上部署公司业务?c). 谈谈你对云计算开展的看法。注:题中商业公司包括课堂上介绍的IBM、Amazon、Google、Salesforce 、Microsoft以及其它现实存在的涉及虚拟化、云计算业务的公司第 6 页
限制150内