《大数据基础与应用》期末试卷及答案2套.docx
《《大数据基础与应用》期末试卷及答案2套.docx》由会员分享,可在线阅读,更多相关《《大数据基础与应用》期末试卷及答案2套.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、期末试卷秘密大数据基础(课程代码:)中It得分评卷人单项选择题(每题2分,共20分)1、当前大数据技术的基础是由()首先提出的。A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是()。A:金融B:电信C:互联网D:公共管理3、大数据的最显著特征是()。A:数据规模大B:数据类型多样 C:数据处理速度快D:数据价值密度高4、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋 流可能发生的地点。这表达了大数据分析理念中的()。A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规
2、模上强调相对数据而不是绝对数据 5、以下关于舍恩伯格对大数据特点的说法中,错误的选项是()oA:数据规模大 B:数据类型多样 C:数据处理速度快D:数据价值密度高6、7、8、6、7、8、当前社会中,最为突出的大数据环境是()。A:互联网 B:物联网在数据生命周期管理实践中,()A:数据存储和备份规范C:数据价值觉察和利用以下国家的大数据开展行动中,C:综合国力I):自然资源是执行方法。B:数据管理和维护D:数据应用开发和管理集中表达“重视基础、首都先行”的国家是(A:美国 B:日本 C:中国 D:韩国 9、以下关于大数据的分析理念的说法中,错误的选项是()。A:在数据基础上倾向于全体数据而不是
3、抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 I):在数据规模上强调相对数据而不是绝对数据 10、万维网之父是().A:彼得德鲁克 B:舍恩伯格 C:蒂姆伯纳斯-李D:斯科特布朗得分评卷人得分评卷人填空题(每空2分,共10分)1、IBM公司用3个V来描述大数据的三个基本特征,这3V是2、大数据环境下的隐私担忧,主要表现为。3、当前大数据技术的基础包括、.4、数据仓库的最终目的是5、按照涉及自变量的多少,可以将回归分析分为评卷人评卷人判断题(每题2分,共20分)1、在噪声数据中,波动数据比离群点数据偏离整体水平更大。()2、对于大数据而言,最基
4、本、最重要的要求就是减少错误、保证质量。因此,大数据提供的 信息量要尽量精确。()3、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此 分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。()4、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展 现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是 数据分析能力对大数据人才的基本要求。()5、谷歌流感趋势充分表达了数据重组和扩展对数据价值的重要意义。()6、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代
5、表最终的分类结果,其优点在于易于实现,决策时间短,并卜L适合处理非数值型数据。() 7、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。()8、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查 对象。在抽取样本时,总体中每个对象被抽中为调有样本的概率可能会有差异。()9、啤酒与尿布的经典案例,充分表达了实验思维在大数据分析理念中的重要性。()10、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比拟重要,而且对不同 兴趣偏好的用户最好集中处理。()评卷人评卷人四、简答题(每题10分,共40分)1、搜索引擎的产生和开展经历了哪几个阶段?试简述各
6、阶段的特点。2、大数据时代数据的存储与管理与传统数据存储方式有何区别?3、常用的数据整理技术有哪些?4、简述大数据存储的概念。(共4页)秘密期末试卷得分评卷人单项选择题(每题2分,共20分)行分评卷入七、 判断题(每题2分,共20分)大数据基础(课程代码:)I、搜索引擎中用户查询所得的信息是()A.直接在互联网中获取的B.存储在网络数据库中的C.来自某个网站的D.与网页连接显示的2、对于搜索引擎蜘蛛(Google称之为机器人)程序来讲有三种页面非常重要,以下哪种页面 不属于其中?()A.从未抓取过的新页面B.页面内容之前被采集过但有所改动的页面C.已被删除掉的之前被采集过的页面D.搜索引擎蜘蛛
7、的起始页面3、以下不属于搜索引擎评价指标的是()。A.查全率B.查准率C.响应速度D.下载速度4、不属于大数据主要的存储模型的是()。A.关系型数据库B.列式数据库C.键值存储D.视频数据库5、不属于关系型数据库的是()。A. Oracle B. Sybase C. DB2 D. Microsoft SQL Server6、数据存储方式有()0A.在线存储B.近线存储 C.异地备份 D.以上皆对7.以下不属于大数据基本特征的是()。A.数据规模庞大B.数据的形式多样化C.数据的获取及处理速度快D.数据的处理具有实时性&数据挖掘中关联规那么分析最典型的算法是()。A. KNN 算法 B. Nai
8、ve Bayes 算法 C. k-incans 算法 D.Aprior 算法9、不属于数据可视化展现方式()oA.鱼骨图B.柏拉图C回归图 D.直方图10、大数据可视化分析工具有(A.Word B.PPT C.Excel D.Google Pinyin1、M叩Reduce的架构分为、 和 这四个组件。2、威胁数据平安的主要因素有:、 和。3、在数据挖掘的分类算法中比拟典型的算法是 算法和 算法。4、.搜索引擎工作工程主耍包括三个阶段,分别是网页阶段,和用户查询服 务阶段。1、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代 表最终的分类结果,其优点在于易于实现,决
9、策时间短,并且适合处理非数值型数据。()2、大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式,可以从海量数据中开展趋 势,虽然也有不精准的时候,但并不能因此而否认大数据挖掘的价值()3、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。()4、在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行()5、大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式,可以从海量数据中开展趋 势,虽然也有不精准的时候,但并不能因此而否认大数据挖掘的价值()6、当前,企业提供的大数据解决方案大多基于Ha doop开源工程()7、大数据可以分析与挖掘前之前人们不知道或者
10、滑注意到的模式,可以从海量数据中开展趋势,虽然也有不精准的时候,但并不能因此而否认大数据挖掘的价值()8、在噪声数据中,波动数据比离群点数据偏离整体水平更大。()9、第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自 己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果() 10、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调 查对象。在抽取产本时,总体中每个对象被抽中为调查样本的概率可能会有差异。()得分评卷人| 八、 简答题(每题10分,共40分)1、根据自己的理解画出HDFS文件系统中文件读取的流程,并解释其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据基础与应用 数据 基础 应用 期末试卷 答案
限制150内