国开大学2023年01月11480《大数据技术导论》期末考试答案.docx
《国开大学2023年01月11480《大数据技术导论》期末考试答案.docx》由会员分享,可在线阅读,更多相关《国开大学2023年01月11480《大数据技术导论》期末考试答案.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试卷代号:11480座位号I国家开放大学2022年秋季学期期末统一考试大数据技术导论试题2023年1月题号二三四总分分数得分评卷人一、选择闻(选择一个正确答案的代码填入括号中,每小就3分,共30分)1.数据科学不仅可以推动数学、计算机科学、统计学、天体信息学等学科的发展,而且又能大力助推( )的发展与进步.A.基础科学C.化学2 .以下()是结构化数据.A.单位工资数据C.声音3 .在MapReduce模型中,Map函数以(A.主键C.他值对R流体力学D.产业K网页D.视频)作为输入.R数据D.键值4 . NoSQL适用于().A.事务处理应用R机器学习应用C.数据分析应用D.互联网应用5 .
2、在大数据抽取中,可以分为初始化转移阶段和增量转移阶段初始化转移阶段采用 ()的方式.A.帝量数据抽取C.同构同质数据抽取R全量数据抽取D.同构异质数据抽取 (11480号)大数据技术导论试卷第1页(共8页)6 .分布式数据库系统的三种类型是:异构型、同构同质型和().A.网络型R层次型C.关系型D.同构异质型7 .数据规范化的主要方法是妓小一最大规范化方法、()和小数定标规范化方法.A.正则法Rz分数规范化方法C.整数定标规范化方法D.极小一极大规疮化方法8 .为了完成特征约简,以下()提法不正确.A.采用特征提取方法R采用特征选择方法C.采用时空编码方法D.从原始特征中找出最有效的特征9 .
3、变异系数是()与均值的比值.A.方差a标准差C.极差D.偏差10 .如果要通过6个方面绘制学生学习行为曲像,采用下面的()比较合适。A.流程图a折线图C.雷达图D.地图得分I评卷人二、判断题(正确的划J,错误的划X,每小题2分,共20分)11 .大数据的价值密度高.()12 .在Hadoop系统中负货存储与管理数据的是NTFS.()13 .网页是主要的网站外部数据,分为静态网页和动态网页.()14 . NewSQL 具有 OldSQL 的 SQL 特性.()15 .数据质量问题经常发生,比如要求填写北京,用户实际填写了北京市、BEIJING、北 京、首都等内容,这些数据明显属于数据的一致性问题
4、.()16 .分箱平滑法是一种数据局部平滑方法它是通过考察所有的数据来平滑存储 数据.()17 .数据约筒前后的分析结果是无法达到相同结果的.()18 .探索性数据分析是从某种假设出发,去探索其内在的数据规律性.()19 . k一均值算法,是广泛应用的一种分类算法.()20 .动态网络可视化的关键是如何将时间属性与图进行融合基本的方法是引入空间轴.)(11480号)大数据技术导论试题第2页(共8页)评卷人三、简答题(每小题5分,共30分)21 .大数据处理的全过程,一般包括哪5个步骤?22 .采用MapReduce程序进行单词计数处理,如下图.请写出经过Map输出到Reduce 输出过程中的中
5、间处理结果,填入该图中间框内。23 .按照系统结构和实现技术,网络爬虫可以分为哪四大类?24.数据清洗算法的街成标准主要包含哪些方面?用 比 法 才为 冽 埸25 .数据集成的含义是什么?主要开展什么活动?26 .下四是19名学生完成满分】8分题的答题结果,请计算:(1)极差是多少?(1分)(2)众数是多少?(2分)(3)中位数是多少?(2分)K-19名学生的答题结果得分评卷人四、应用题(每小题10分,共20分)27.对某地观察连续8天的天气状况如图所示:周一 (3B)7RH例期3n/24*C周二(40)I GG雨30Y/22T南同传东南风周三(5B)i GG雨29X/23X南风的东丽周四(6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术导论 大学 2023 01 11480 数据 技术 导论 期末考试 答案
限制150内