南开大学22春学期《大数据导论》在线作业答卷.docx
22春学期(高起本1709T803、全层次1809-2103)大数据导论在线作业-00001 试卷总分:100得分:100一、单选题(共15道试题,共30分)1 .大数据的最显著特征是()。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高答案:A.下列不属于商业大数据类型的是A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据答案:B3,下面哪一项不是中国发展大数据产业的基础()。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱答案:D.()是 Microsoft Office 的核心组件A. SQLWORDB. PPTEXCEL答案:D.以下不是数据仓库基本特征的是()A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的答案:B.第一个提出大数据概念的公司是()。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司答案:A购物篮问题是#的典型案例A.数据变换.关联规则挖掘C.数据分类答案:B8 .数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()oA.运营式系统阶段9 .用户原创内容阶段C.感知式系统阶段答案:AGFS中的文件切分成()的块进行存储A. 32MB64MBB. 128MB1G答案:B. MapReduce中的Map和Reduce函数使用()进行输入输出A.key/value 对B.随机数值C.其他计算结果答案:A11 .哪个选项不属于大数据4V特点?A. VolumeValidB. VarietyValue答案:B.用于描述相等时间间隔下连续数据随时间变化趋势的是()A.折线图B.散点图C.条形图D.饼图答案:A.下列哪个R语言扩展包可以创建带有点和边的网络图()A. ggplot2networkB. ggmapsD.animation答案:B14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段答案:C15 .以下哪项不是数据可视化工具的特性0A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可答案:D二、多选题(共15道试题,共30分).可视化工具包括()A.ExcelB.Google ChartC.GephiD. ppt答案:ABC17.可使用#, #, #进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值答案:BCD18.以下可以用于数据可视化的是()。A. R语言B.ExcelC. RapidMinerWeka答案:ABCD19.关于R语言扩展包下列正确的是()A. network可创建带有点和边的网络图animation可制作一系列的图像并将它们串联起来做成动画B. ggmaps通过树图来可视化层次型数据protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具 答案:AB20 .借助于大数据提供的#和#,政府可为农业生产进行合理引导,依据需求进行 生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果答案:AB21 .下列属于传统统计学展示方法的是()A.柱状图B.饼状图C.曲线图D.网络图答案:ABC22 .主流分布式计算平台有()A.googleB. IBMbaiduD.Amazon答案:ABD23.大数据在医疗中的应用有()A.流行性疾病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发答案:ABCD24 .基于大数据的临床决策支持系统的架构包括A.支撑层B.大数据分析层C.网络层D.应用层答案:ABD25 .数据分析的类型根据数据分析深度可以分为0A.描述性分析B.预测性分析sC.规则性分析答案:ABC.大数据时代预测人类移动行为的数据特点是A.多样化B.数据量大C.维数高D.变化快答案:BCD.百度大数据引擎主要包含三大组件()A.开放云B.数据工厂C.百度大脑。答案:ABC.统计图表的可视化方法主要包括0A.散点图B.折线图C.条形图D.饼图答案:ABCD.云计算是#礼#, #的发展?,是虚拟化、效用计算、laaS (基础设施即服务)、 PaaS(平台即服务)、Saas (软件即服务)等概念混合演进并跃升的结果。A.流计算B.分布式计算C.并行计算D.网络计算答案:BCD.大数据在教育中的应用A.网上公开课B.慕课C.智慧校园D.翻转课堂答案:ABCD三、判断题(共20道试题,共40分)26 .数据的集中存储增加了数据泄露风险。答案:正确.发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。答案:正确.数据存在形式包括结构化数据和结构化数据答案:错误.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性 的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。答案:正确.基于腾讯大社交平台独特基因,以海量用户为基础,以大数据洞察为核心,以智 能定向推广为导向,广点通提供一站式网络推广营销平台。答案:正确.原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个 阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。答案:正确.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电 子商务、社交网络等 领域的半结构化数据和非结构化数据答案:正确.广播变量在广播后可以修改答案:错误.预测性分析(Predictive Analysis)用于预测未来事件发生的概率和演化趋势 答案:正确27 .数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅 读、理解和运用数据答案:正确28 .用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路 段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。答案:正确.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异 常点、离群点或孤立点。答案:正确.按照数据量的大小,可将数据分析分为内存级数据分析、B1级数据分析和海量 级数据分析。答案:正确. Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一 个巨大的“数据乐园”。人们越来愈倾向于在Facebook上表达自己的情绪。答案:正确.美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”答案:正确.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高答案:正确.树状图(Tree)通常用于表示层级、上下级、包含与被包含关系。答案:正确.大数据从概念化走向价值化是大数据的发展趋势答案:正确.时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关 的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展 示答案:正确.大数据数据量一定是PB, TB级的答案:错误