2022年大数据复习题 .pdf
《2022年大数据复习题 .pdf》由会员分享,可在线阅读,更多相关《2022年大数据复习题 .pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、单选题1、大数据的起源是( B) 。A:金融 B:互联网 C:电信 D:公共管理2、大数据的最明显特点是(B) 。A:数据类型多样 B:数据规模大 C :数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D) 。A:数据收集 B:数据存储 C:数据分析 D :数据再利用4、云计算分层架构不包括(D) 。A: Iaas B: Paas C: Saas D: Yaas5、大数据技术是由( C)公司首先提出来的。A:阿里巴巴 B:百度 C:谷歌 D :微软6、数据的精细化程度是指(C) ,越细化的数据,价值越高。A:规模 B:活性 C:颗粒度 D:关联性7、数据清洗的方法不包括
2、(C)A:噪声数据清除 B:一致性检查 C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。A:网络爬虫 B:API 接口 C:传感器 D:统计报表9、下列关于数掲重组的说法中,错误的是(A) 。A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成D:有利于新的数据模式创新名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 14 页 - - - - - - - - - 10、美国海军军官莫里通过对前人航海日志的分
3、析,绘制考了新的航海路线图, 标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( B) 。A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于含思伯格对大数据特点的说法中,错误的是(D)A:数据规模大 B:数据类型多C:处理速度快 D :价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网 B:自然环境 C:综合国力 D :物联网13、在数据生命周期管理实践中, (B)是执行方法。A:数据存储和各份规范B:数据管理和维护 C:数据价值发觉和
4、利用 D :数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C) 。A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B) 。A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相仪度尽可能小名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2
5、页,共 14 页 - - - - - - - - - D:与分类挖据技术相似的是,都是要对数据进行分类处理16、 下列国家的大数据发展行动中, 集中体现“重视基础都先行”的国家是( D)A美国 B:中国 C:日本 D:韩国17、万维网之父是( C)A彼得德鲁克 B:杨振宁 c:蒂姆 ? 伯纳斯 -李 D:钱学森18、下列关于数掲交易市场的说法中,错误的是(C)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D:数据交易市场是大数据资源化的必然产物下列论据中,能够支掉“大数
6、据无所不能”的观点是(A)A:互联网金融打破了传统的观念和行为B:大数据具有非常高的成本 C:大数据存在泡沫D :个人隐私泄露与信息安全担忧20、数据仓库的最终目的是(D)A开发数据仓库的应用分析B:收集业务需求C:建立数据仓库逻辑模型 D:为用户和业务部门提供决策支持21、信息时代的三大定律不包括(A)A:牛顿定理 B:摩尔定律 C:麦特卡尔夫定律D:吉尔德定律22、信息技术( IT)不包括( D)A:计算机技术 B:通信技术 C:传感技术 D:新材料技术23、云计算的特点不包括(D ) 。A:高性价比 B:服务可计算 C:服务可租用 D:低使用度24、关于大数据在社会综合治理中的作用,以下
7、描述不正确的是名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 14 页 - - - - - - - - - (C)A:大数据的运用有利于走群众路线B:大数据的运用能够维护社会治安 C:大数据的运用能社绝抗生素的滥用D:大数据的运用能够加强交通管理A:身份假冒 B:隐私露 C:商业问课 D:以上都有大数据的利用过程是(D )A:果集 - 挖提-清洗- 统计 B:果集一统计 -清洗一挖据 C:采集 -清洗一挖据 -统计 D:采集一清洗 - 统计-挖据26、大数据的本质是( A
8、)A:洞察 B:采集 C:统计 D:联系27、大数据元年是 (D )A:2010年 B:2011年 C:2012 年 D:2013年28、 (B)提供的支撑技术,有效的解决了大数据分析、研发的问题,比如:虚拟化技术、并行计算、海量存储及管理等。A:点计算 B:云计算 C:面计算 D:线计算29、 (D)提出在今后的十几年里,半导体处理器的性能,每18个月左右可以翻一番。A:牛顿 B:爱因斯坦 C:比尔盖茨 D:戈登摩尔30、从社会稳定角度看,信息安全主要包括造成重大社会影南,产生重大经济损失的信息安会事件,具体包括(D)方面31、从信息安全涉及内容来看,一般物理安全不包括(A)方面。A:备份与
9、恢复 B:环境安全 C:设备安全 D:媒体安全32、大数据方法的不准确性,根本原因是(D) 。A:数据量大 B:算法变化 C:信息遗渴 D :以上都正确33、当今时代步入了一个信息化助力社会全方位创新的重要时期,具体包括( D) 。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 14 页 - - - - - - - - - A:云计算 B:物联网 C:移动互联和人工智能D:以上都是34、互联网新生业态中新兴经济形态包括(B) 。A:网红经济 B:平台经济 C:粉丝经济 D
10、 :生态经济以下哪些可以属于智慧城市的范畴(E) 。A:智慧政务 B:智慧交通 C:智慧医疗 D :智慧公共安全E:以上都是36、人类的思维模式不包括哪一种(C)A逻辑思维 B:. 直观思维 C :胡乱思维 D:顿悟思维37、信息素养不包括( A) 。A:信息体系 B:信息能力 C:信息意识 D :信息道德38、信息的碎片化导致了(E)的碎片化。 A:时间 B:空间 C:资源 D :结构 E:以上都有39、新体采用的技术不包括(D) 。A:数字技术 B:网络技术 C:移动通信技术 D:碎片技术40、曾经,绝大多数的网络设备都来自于思科,同时几乎所有的( E)都由思科掌握。 A:超级核心节点 B
11、:国际交换节点C:国际汇聚节点 D:互联互通节点 E:以上都包括41、下面哪个 (C)程序通常与 Namenode A在个节点启动 A: TasktrackerB: DatanodeC: JobtrackerD: secondarynamenode42、Hadoop的作者是( C)A: Martin Fowler B: Kent Beck C: Doug cutting DBILL43、HDFS 默认 Block Size(C) 。A:16MB:32MC:64MD:128M44、下列哪项通常是集群的最主要瓶颈(D) 。A:内存 B:CPUC :网络 D:磁盘 1/0名师资料总结 - - -精品
12、资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 14 页 - - - - - - - - - 45、发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备:给定最小支持度和(D) ,利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则。A:最小兴趣度 B:最小置信度 C:最大支持度 D:最小可信度46、 个性化推荐系统是建立在海量数据挖据基础上的一种高级商务智能平台,以帮助( C )为其顾客购物提供完全个性化的决策支持和信息服务。A:公司 B:单位 C:电子商务网站D :跨
13、国企业47、云计算是对( D )技术的发展与运用。A:并行计算 B:分布式计算 C:网格计算 D:以上都是48、 (B)是gl提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。A:GFS B: Mapreduce C: Bittable D: Chubby49、在 Bigtable中, (A)主要用来存储子表数据以及一些日志文件。A: GFS B: Mapreduce C: Sstable D: Chubby50、躁声数据的产生原因主要有(D)A:采集设备有问题B:数据录入过程中产生错误C:数据传输过程出现错误D:以上都有51、下面属于数据集的一般特性的有(D) 。A:维
14、度 B:稀疏性 C:分辨率 D:以上都有52、噪声数据处理的方法主要有(D) 。A:分类 B:聚类 C:回归D:以上都有53、如下哪些不是最近邻分类器的特点(C)A:它使用具体的训练实例进行预测,不必维护源自数据的模型B:分类一个测试样例开销很大C:最近邻分类器基于全局信息进行名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 14 页 - - - - - - - - - 预测D:可以生产任意形状的决策边界54、数据挖据的挖据方法包括 (乙)A:聚类分析 B:回归分析 C:神
15、经网络D:决策树算法 E:以上都是55、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(B),推测客户将来可能的购买行为。A:客户的朋友 B:客户过去的购买行为和购买记录C:客户的兴趣爱好D:客户的个人信息56、数据预处理方法主要有(E)A:数据清洗 B:数据集成 C:数据归约D:数据交换 E:以上都是57、大数据环境下的隐私担忧,主要表现为(A)A:个人信息的被识别与暴露B:用户画像的生成 C:恶意广告的推送 D :病毒入侵58、对线下零售而言,做好大数据分析应用的前提是(C)A:增加统计种类 B:扩大营业面积 C:增加数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年大数据复习题 2022 数据 复习题
限制150内