《【信息技术】数据科学与大数据同步练习.docx》由会员分享,可在线阅读,更多相关《【信息技术】数据科学与大数据同步练习.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据科学与大数据学校:_姓名:_班级:_考号:_一、选择题1下列关于大数据及数据处理的说法,正确的是()A流数据是实时数据,其价值会随时间流逝而降低B近四年信息选考模拟卷的考点属于流数据C流数据和静态数据不可以在同一平台进行处理D交通大数据属于流数据,一般适用于批处理计算2地图软件的驾车导航、步行导航、骑行导航等功能给我们的生活带来了极大的便利。用户在使用地图软件的驾车实时导航功能时,软件会实时获取我们的位置、车速、方向、时间等信息,将数据发送给服务器,服务器将获取到的信息进行分析处理,转换为车流量信息,判断交通的拥堵情况并返回给用户,以不同颜色来呈现拥堵情况。阅读材料,下列说法不正确的是()
2、A地图软件对采集的实时数据进行批处理得到车流量信息B该地图软件分析处理数据可能用到了分而治之的思想C实时车况数据的价值随着时间的流逝而降低D用户既是数据的使用者,也是数据的生产者3小张从北京出差至杭州。出发前,他在手机上登入12306售票系统购买火车票、完成支付,检票时刷身份证通过闸机。到杭州站下车后,小张在手机量航软件中通过语音输入目的地规划行程路线,打车前往宾馆,途中导航软件会在地图中实时显示道路拥堵状况等信息。根据阅读材料,下列关于大数据的说法,不正确的是()A大数据既有人工产生的,也有机器自动产生的B大数据蕴含着巨大的价值,价值密度相对较高C大数据要分析的是全体数据,而不是抽样数据D大
3、数据给生活带来便利的同时,也带来如数据安全等方面的社会问题4关于大数据特征,下列描述正确的是()A数据量少B数据产生速度慢C数据价值密度高D数据类型多5手机导航能实时提示前方路况,这主要体现了大数据的()巨量性多样性迅变性价值性ABCD6关于大数据与数据处理的说法,不正确的是()A大数据分析的是全体数据,能接受数据的混杂性B大数据更关注事物的因果关系而不是相关性C大数据蕴含很高的价值,但价值密度相对较低D文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现7下列场景中没有体现大数据在疫情防控中运用的是()A利用人脸测温识别设备采集到的数据与全国城市管理数据结合在一起,实现对流动人群的身
4、份、位置、行程等信息的全面掌控B将某企业人员数据库管理系统连通当地城市疫情数据管理平台,实时传送健康数据,帮助政府或企业实现人员疫情管理C疫情暴发后,分析多少人流向一线城市,多少人流向广大农村,获得病毒的流向和分布,以便帮助相关部门制定应急响应和物资投放政策D乘车人填写“健康码申报表单”后获得自己的健康码8从电商平台购买了地下秦朝这本书后,该网站就会不断推送有关“历史”方面书籍的信息,下面说法错误的是()A网络大数据来自于各地的终端,数据产生速度快,价值密度高B大数据成为提取信息,做出决策的重要依据C使用网络、手机等信息技术工具都会产生数据,这些数据存在泄漏的危险D网络购物不但节省了出行购物的
5、时间,还可以帮助企业有效分析客户需求9近年来,随着大数据、云计算、物联网、人工智能等技术的出现和升级,数字经济俨然成为继农业经济、工业经济之后的新兴经济形态,下面不是大数据的是()A北斗气象卫星采集的气象数据B某校高一5班同学的学籍信息C用户使用、浏览某电商平台的数据D各金融机构之间交易产生的数据10当今社会,数据体现出了前所未有的价值。每时每刻都有数据被人们发现、分析、利用,创造出巨大的财富,数据改变着我们生活的方式。随着大数据时代的发展,我们也会面临新的挑战,这些挑战不包括()A对个人隐私的挑战B对社会监督的挑战C对国家立法的挑战D对世界历史的挑战11从互联网产生大数据的角度来看,大数据具
6、有的特征是()A“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)B大数据存储在互联网不同的服务器与各客户终端C分布式存储,分布式并行计算D样本渐趋于总体,精确让位于模糊,相关性重于因果12短视频APP利用大数据技术分析用户在不同视频上停留的时间,针对用户喜好推送视频。这主要运用了()A大数据采集技术B大数据存储技术C大数据预处理技术D大数据分析技术13利用某专业气象大数据平台进行气象预测,下列描述正确的是()A该平台数据之“大”,不仅指数据规模大,还包括数据产生的速度快、数据类型多等特点B平台获取的大数据对指导农林畜牧业开展工作有巨
7、大的影响,体现了数据越多价值密度越高C该系统对大数据进行计算的过程中依赖于抽样数据,而不是全体数据D平台对于获取的数据需要确保数据都准确无误,一个数据错误将导致预测错误14体感技术与自然语言交互是继键盘+鼠标、多点触控之后获得广泛应用的第三大类操作方式。体感技术使人们无须借助复杂的控制设备,直接使用肢体动作与数字设备和环境进行互动,并根据人的动作来完成各种指令,就像为计算机配备了一双精准有效的“眼睛”。体感技术不但是一种创新的操控方式,在大数据和人工智能技术的助力下,它还拥有强大的数据监测和数据分析功能,为人们提供更加个性化的服务。可以预期,未来的体感交互将体现为可穿戴设备的形式,成为“数字土
8、著”一代身上的必备学习品,为用户带来更刺激、更具现场感的愉悦学习体验。下列关于大数据和大数据处理说法正确的是()A处理大数据时一般采用分治思想B体感技术中所监测到的数据都属于静态数据C大数据通常对抽样数据进行分析,强调事物之间的关联性D文本数据处理一般先进行数据分析,再进行分词、特征提取等处理15大数据领域中,为了提高数据质量、降低数据计算的复杂度、提升数据处理的准确性。常用的技术是()A预处理技术B存储技术C管理技术D挖掘技术16市交通智能化大数据分析平台的实时数据来源于交通部门、电信、相关企业等服务器中。该事例主要体现的大数据的特征是()A价值密度低B数据类型繁多C变化速度快D分布式存储1
9、7下列关于大数据的说法,正确的是()A大数据要分析的是全体数据,而不是抽样数据,且要求数据必须是精确无误的B处理大数据时,一般采用分治思想C处理大数据时,更注重事物的因果关系而不是相关性D实现对实时数据的获取、传输和存储可以采用分布式系统完成18下列关于大数据的说法,不正确的是()A处理大数据时,一般采用分治思想B社交网络数据可采用图计算进行处理C速度快是大数据的特征之一,仅指数据的产生速度快D价值密度的高低与数据总量的大小成反比试卷第3页,共4页学科网(北京)股份有限公司参考答案:1A【详解】本题考查数据与大数据相关内容。在大数据时代,数据可以分为静态数据和流数据,静态数据是指在很长一段时间
10、内不会变化,一般不随运行而变化的数据。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下数据流可被视为一个随时间延续而无限增长的动态数据集合,应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域,流数据的价值随着时间的流逝而降低,因此,当事件出现时就应该立即进行处理。A选项说法正确。B选项,近四年信息选考模拟卷的考点属于静态数据,选项说法错误。C选项,流数据和静态数据可以在同一平台进行处理,选项说法错误。D选项,交通大数据属于流数据,一般适用于流处理计算,选项说法错误。故本题答案是A选项。2A【详解】本题考查数据与大数据相关内容。A选项,批处理适合于非实时的大规模数据处理任
11、务,而流处理适合于需要快速响应的实时数据处理任务;地图软件对采集的实时数据进行流处理得到车流量信息,选项说法错误。BCD选项说法正确。故本题答案是A选项。3B【详解】本题考查的是大数据相关知识。大数据具有的特征是:数据体量巨大、速度快、数据类型多、价值密度低。故本题应选B。4D【详解】本题考查大数据特征相关内容。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据的4V特征是指:Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(价值密度低)。故本题答案是D选项。5C【详解】本题考查大数据的特征。大数据是以容量
12、大、类型多、存取速度快、应用价值高为主要特征的数据集合。手机导航能实时提示前方路况,这主要体现了大数据的讯变性和价值性。故选C。6B【详解】本题考查大数据相关内容。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。A选项,大数据分析的是全体数据,能接受数据的混杂性,选项正确。B选项,大数据更关注事物的相关性而不是因果关系,选项错误。C选项,大数据蕴含很高的价值,但价值密度相对较低,选项正确。D选项,文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现,选项正确。故
13、本题答案是B选项。7D【详解】本题考查大数据技术应用相关内容。大数据一般的定义为:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。ABC选项体现了大数据在疫情防控中的运用。D选项,生成健康码应用了二维码技术。故本题答案是D选项。8A【详解】本题考查大数据的相关内容。大数据具备“4V”特征:大量、多样、低价值密度、高速。此外,有效的数据分析能够给我们的日常生活带来极大便利,不过我们要时刻保持清醒,以免数据泄露,被不法分子利用,对自己及亲人造成伤害。故本题答案是A选项。9B【详解】本
14、题考查大数据特征相关内容。大数据是指无法在可承受的时间范围内用常规软件工具进行高校捕捉、管理和处理的数据集合。大数据具备“4V”特征:大量、多样、低价值密度、高速。某校高一5班同学的学籍信息数据量很小,可以用常规软件工具处理,不是大数据。故本题答案是B选项。10D【详解】本题考查大数据相关内容。随着大数据时代的发展,我们也会面临新的挑战,这些挑战包括对个人隐私的挑战、对社会监督的挑战、对国家立法的挑战。总的来说,大数据在这个时代中的价值是巨大的,可以帮助我们更好地了解事物的发展规律,并为人类社会带来更多的价值。而面对大数据带来的挑战,我们需要继续深入研究并开发出更加高效的技术方式,以应对数据安
15、全、处理能力以及数据分析的问题,从而更好地利用大数据为人类社会的发展提供支持。故本题答案是D选项。11A【详解】本题考查大数据的特征。从互联网产生大数据的角度来看,大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity);大数据存储在互联网不同的服务器;分布式存储,分布式并行计算是Hadoop系统的两个部分;从互联网思维角度看:大数据具有样本渐趋于总体,精确让位于模糊,相关性重于因果的特点。故选A。12D【详解】本题考查大数据技术。大数据分析技术是指对大量数据进行处理和分析,以提取有价值的信息和洞察。短视频APP利用大数据技术分析
16、用户在不同视频上停留的时间,针对用户喜好推送视频,这主要运用了大数据分析技术。故选:D。13A【详解】本题考查大数据相关内容。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据特征有:数据量大、数据类型多、处理速度快和价值密度低。A选项,选项正确。B选项,平台获取的大数据对指导农林畜牧业开展工作有巨大的影响,体现了数据越多价值密度越低,选项错误。C选项,大数据进行计算的过程中依赖于全体数据,选项错误。D选项,在大数据处理中,不需要对每一条数据的精确性要求非常高,只需要保证数据的总体准确性即可,选项错误。故本题答案是A选项。14A【详解】本题考查大数据。A选项
17、正确,分治思想是一种处理大规模数据的常用方法,即将大数据分解成小规模的子问题,然后分别解决这些子问题,最后将结果合并。这种方法有助于提高数据处理的效率和可扩展性。B选项错误,体感技术通常监测到的数据是动态数据,即与人的肢体动作、姿态等相关的实时数据。这些数据随着时间的推移会不断变化,而不是静态的。静态数据通常指固定不变的数据,例如存储在数据库中的信息,与体感技术所涉及的实时监测和动态交互不符。C选项错误,大数据通常不对抽样数据进行分析,而是利用全部数据进行分析,以获取更全面、更准确的结果。大数据分析的重点是发现数据之间的模式、规律和趋势,而非仅仅强调事物之间的关联性。D选项错误,通常,在处理文
18、本数据时,首先进行的是数据预处理,包括文本清洗、标准化等操作,然后才进行数据分析和特征提取。数据预处理的目的是清理数据,减少噪音和不必要的信息,为后续的分析和建模提供高质量的数据。故答案为:A。15A【详解】本题考查大数据技术相关内容。大数据预处理技术是指在进行大数据分析之前,对原始的大量数据进行清洗、转换、集成和规范化等一系列操作,以提高数据的质量、可用性和可操作性。故本题答案是A选项。16D【详解】本题考查大数据的特征。从数据来源涉及交通部门、电信、相关企业等服务器可以推测,数据分布在不同的地方,因此分布式存储是该事例主要体现的大数据特征。故答案为:D。17B【详解】本题考查大数据相关内容
19、。A选项,大数据要分析的是全体数据,不是抽样数据,大数据具有低价值密度性,所以大数据无需每个数据都准确无误,选项错误。B选项,处理大数据时,一般采用分治思想(把最初的问题分解成若干子问题,然后,在逐个解决各个子问题的基础上得到原始问题的解),选项正确。C选项,处理大数据时,更注重事物的相关性而不是因果关系,选项错误。D选项,实现对实时数据的获取、传输和存储可以采用Flink完成。Flink 是一个开源的流处理框架,支持窗口操作、聚合操作、连接操作等复杂计算。Flink 还提供了容错机制,可以在数据处理过程中实时修复错误,并可以通过 Checkpoint 机制实现数据的容错。Flink 的优点是支持流式计算,可以处理大规模的数据流,适用于处理实时数据。选项错误。故本题答案是B选项。18C【详解】本题考查大数据相关内容。大数据的数据体量大,在处理时需采用分治思想,选项A正确;对社交网络、网购行为等数据一般采用图计算方式进行处理,选项B正确;大数据的速度快不仅仅指处理速度快,还体现在产生速度快,选项C错误;大数据的价值密度的高低与数据总量的大小成反比,选项D正确;故本题答案是C选项。答案第3页,共4页学科网(北京)股份有限公司
限制150内