(优质)大数据技术知识考核试题与答案.docx
《(优质)大数据技术知识考核试题与答案.docx》由会员分享,可在线阅读,更多相关《(优质)大数据技术知识考核试题与答案.docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术知识考核试题一、选择题1.大数据的本质是(I 单项选择题*A.洞察B.C.联系D.挖掘V2 .网络安全与信息化领导小组成立的时间是:()单项选择题*A. 2015B. 2012C. 2013D. 2014V3 .智能健康手环的应用开发,表达了()的数据采集技术的应用。单项选择题*A.统计报表B.网络爬虫C. API 接口D.传感器V4.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。单项选择题*A.关联规那么挖掘VD.数据价值密度高V38.假设12个销售价格记录组已经排序如下5,10,11,13,15, 35, 50, 55, 72, 92, 204, 215使用
2、如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内( 单项选择题*A.第TB.第二个VC.第三个D.第四个39 . 2012年全国各城市支付宝人均支出排名中,位居第T立的是()单项选择题*A.嘉兴市B.杭州市C.嘉义市VD.高雄市40 .以下大数据分析的实际问题,能够应用聚类方法建模的是()单项选择题*A.财政收入影响因素分析41 航空公司客户价值分析,C.商品零售购物篮分析D.门禁的人脸识别系统41 .如果对属性值的任一组合,R中都存在一条规那么加以覆盖,那么称规那么集R中的规那么 为( 单项选择题*A,无序规那么B.穷举规那么VC.互斥规那么D.有序规那么42 .关于大
3、数据在社会综合治理中的作用,以下理解不正确的选项是(单项选择题*A.大数据的运用有利于走群众路线B.大数据的运用能够维护社会治安C.大数据的运用能够杜绝抗生素的滥用VD.大数据的运用能够加强交通管理43.标准偏差(SD , Standard Deviation )越小,这些值偏离平均值就越少。所以,标 准差能反映一个数据集的( 单项选择题*A.平稳程度B.变化程度C.精密程度D.离散程度,44.概念分层图是()图。单项选择题*A,无向无环B.有向无环VC.有向有环D.无向有环45 .在基于图的簇评估度量表里面,如果簇度量为proximity(Ci , C),簇权值为mi , 那么它的类型是(
4、单项选择题*A.基于图的凝聚度B.基于原型的凝聚度C.基于原型的别离度VD.基于图的凝聚度和别离度46 .活字印刷术是由()创造的。单项选择题*A.商鞅B.鲁班C.蔡伦D.毕昇V47.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()?单项选择题*A.探索性数据分析VB.建模描述C.预测建模D.寻找模式和规那么48 .()年,局部计算机专家首次提出大数据概念。单项选择题*A. 2010B. 2011C. 2006D. 2008V49 .算法不属于聚类算法的是(1 单项选择题*A. K-Means 算法B. K-中心算法C. Apriori 算法VD. CLIOUE 算法50
5、 .习近平总书记曾指出,没有()就没有国家安全,没有信息化就没有现代化。单 选题*A.网络安全VB.信息安全C.基础网络D.互联网51 .()大数据交易所2015年4月14日正式运营,目前,交易所已有包括京东、 华为、阿里巴巴等超过300家会员企业,交易总金额突破6000万元。单项选择题*A.贵阳VB.遵义C.毕节D.安顺52 . ABC分类中畅销的、库存周转率高的高价值商品为()单项选择题*A.B类B.C类C. A 类VD.都不属于53 .以下关于网络用户行为的说法中,错误的选项是( 单项选择题*A.网络公司能够捕捉到用户在其网站上的所有行为B.用户离散的交互痕迹能够为企业提升服务质量提供参
6、考C.数字轨迹用完即自动删除。D.用户的隐私安全很难得以规范保护54 . 一切皆可连,任何数据之间逻辑上都有可能存在联系,这表达了大数据思维中的(X 单项选择题*A.定量思维B.相关思维VC.因果思维D.实验思维55 .以下指标和分类算法性能无关的是( 单项选择题*A.平均绝对误差MAEVB.均方误差MSEC. ResidualD.均方根误差RMSE56 .可视化模型有助于理解可视化的具体过程,常用的可视化模型不包括( 单项选择 题*A.循环模型B.分析模型C.递进模型VD.顺序模型57 .数据挖掘的经典案例啤酒与尿布试验”最主要是应用了()数据挖掘方法。单 选题*A.分类B.预测C.关联规那
7、么VD.聚类58 .下面关于Jarvis - Patrick (JP )聚类算法的说法不正确的选项是(单项选择题*A.JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。B.JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。C.JP聚类是基于SNN相似度的概念。D.JP聚类的基本时间复杂度为0(m)。V59 .数据挖掘是一个交叉学科,但是,以下哪一个领域的研究成果和学术思想,不是数据挖掘的主要学科来源( 单项选择题*A.统计分析B.人应工程VC.机器学习D.人工智能60 .商品分析中的重点商品选择可以借助()方法单项选择题*A.回归分析B.相关分析C.漏斗分析D. A
8、BC分类V61 .大数据的价值是通过数据共享、()后获取最大的数据价值单项选择题A.算法共享B.应用共享C.平台共享D.交叉复用V62 .以下国家的大数据开展行动中,集中表达重视基础、首都先行的国家是( 单项选择题*A.美国B.日本C.中国D.韩国V63.根据数据专家所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。单 选题*A. 21B. 30C.25D. 38V64.下面关于数据粒度的描述不正确的选项是(I 单项选择题*A.粒度是指数据仓库小数据单元的详细程度和级别B.数据越详细,粒度就越小,级别也就越高C.数据综合度越高,粒度也就越大,级别也就越高VD.粒度的具体划分将直接影响数
9、据仓库中的数据量以及直询质量65.平均停留时长和跳失率都是()的分析内容单项选择题*A.交易分析B.流量分析VC.访客分析D.商品分析66.目前有多种成熟的知识可视化工具,下面()不属于这类可视化工具。单项选择题* A.概念图B.思维导图C,认知地图D.趋势图V67 .雷达图适用于()数据,且每个维度必须可以排序。单项选择题*A. 一维B.二维C.三维D.多维V68 .以下四项中,不属于数据库特点的是(I 单项选择题*A.数据共享B.数据完整性C.数据冗余很高VD.数据独立性高69 .()是位于用户与操作系统之间的一层数据管理软件,它属于系统软件,它为用户 或应用程序提供访问数据库的方法。数据
10、库在建立、使用和维护时由其统一管理、统一控制。 单项选择题*A. DBMSVB. DBC. DBSD. DBA70 .在SQL中,建立表用的命令是( 单项选择题*A. CREATE SCHEMAB. CREATE TABLEVC. CREATE VIEWD. CREATE INDEX71 . SQL的视图是从()中导出的。单项选择题*A.基本表B.视图C.基本表或视图VD.数据库72 .以下哪个不是sql数据库文件的后缀(X 单项选择题*A. .mdfB. JdfC. .tifVD. .ndf73 .数据定义语言的缩写词为(工单项选择题*A. DDLVB. DCLC. DMLD. DBL74
11、.目前()数据库系统已逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的商用数据库系统。单项选择题*A.关系VB.面向对象C.分布D.面向应用75 .以下关于舍恩伯格对大数据特点的说法中,错误的选项是( 单项选择题*A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高。76 .流量质量评估采用()作为衡量流量有效性的宏观指标单项选择题*A.访客数77 转化率VC.浏览量D.浏览时长77 .据Ward M 0(2010)的研究,超过()的人脑功能用于视觉信息的处理,视觉信 息处理是人脑的最主要功能之一。单项选择题*A. 30%B. 50%VC. 70%D. 40%78 .当前,市
12、场上已经出现了众多的数据可视化软件和工具,下面工具不是大数据可视B.分类与回归C.聚类分析D.时序预测5 .企业在面向客户制定运营策略和营销策略时,希望能针对不同客户推行不同策略, 即希望对客户群体进行细分,这个问题属于()单项选择题*A.关联规那么挖掘B.回归问题C.聚类分析VD.时序预测6 .对本月股票走势进行预测,属于()单项选择题*A.关联规那么挖掘8 .回归问题C.聚类分析D.时序预测V7 .如果规那么集R中不存在两条规那么被同一条记录触发,那么称规那么集R中的规那么为( 单项选择题*A.无序规那么8 .穷举规那么C.互斥规那么VD.有序规那么8.支撑大数据业务的基础是( 单项选择题
13、*A.数据科学化工具的是()o 单项选择题*A. TableauB. DatawatchC. PlatforaD. PhotoshopV79 .数据挖掘常见的工具或算法,不包括( 单项选择题*A.聚类B.分类C.排序,D.预测80 .从宏观角度看,数据可视化的功能不包括(I 单项选择题*A.信息记录81 信息的推理分析C.信息清洗VD.信息传播1 .切片是指维的位置互换。判断题*对错V2 .旋转是指选择维中特定区间的数据或者某批特定值进行分析。判断题*对错V3 . RFM模型的F值越大表示客户交易越频繁。判断题对V错4 .多维数据模型是从多角度多层次进行数据查询和分析的的数据库模型。判断题*对
14、V错5 . RFM模型是根据客户活跃程度和交易金额的贡献,进行客户价值细分的方法。判 断题*对V错6 .数据可视化的本质就是借助于图形等各种手段,清晰有效地传达与沟通信息。判断 题*对V错7 .在可视化图形中,应该尽量使用3D图形,因为更加立体好看!判断题*对错V8 .数据墨水比的比值越低,说明图表中越多的视觉编码被用于传递真正的信息,而不 是出现冗余,或者用于描述一些其他的东西判断题*对错V9 .格式塔原那么的核心是整体决定局部的性质,局部依从于整体?判断题*10 .本质上,可视化是一个抽象的过程,是把数据映射到了几何图形和颜色上。从技术 角度看,这很容易做到。难点在于,要知道什么形状和颜色
15、是最合适的、画在哪里以及画 多大。判断题*对V错11 .数据可视化,是关于数据视觉表现形式的科学技术研究。判断题*对V错12 . MAP软件和Tableau软件,都属于无需编程语言的可视化工具。判断题*对V错标题判断题*对V错13 .散点图既可以展示数值分布又可以表示数据之间的关联。判断题*对V错14 .箱线图中箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包 含了 50%的数据。判断题*对V15 .饼图缺乏在于分类过多,那么扇形越大,无法展现图表判断题*对错V16 .热力图,也可以称为热图、热量表、密度表,主要用于展示数据的分布情况。判 断题*对V错17 .柱状图的局限在于它
16、仅适用于中小规模的数据集,当数据较多时就不易分辨。判 断题*对V错18 .方差是总体各标志值与其算数平均数的离差的平方和的算数平均数。判断题*对V错19 .方差和标准差在离散趋势中表达的内容完全相同。判断题*对错V20 .分位数可以用来描述离散程度,最常用的是四分位数。判断题*对V错1、根据大数据分析与挖掘课程数据中的数据探索性分析,请使用合适工具,合适方法完成下述分析内容:填空题答案解析:(1)简述数据探索性分析的基本步骤。数据探索性分析,首先需要确定数据的类别,是数值型数据还是类别数据。对于类别数据,一般需要看类别数据各取值的频数分布,可以采用直方图或者饼图。对于数值型数据,如果需要看数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优质 数据 技术 知识 考核 试题 答案
限制150内