国家开放大学大数据预处理期末考试复习资料汇编.pdf
《国家开放大学大数据预处理期末考试复习资料汇编.pdf》由会员分享,可在线阅读,更多相关《国家开放大学大数据预处理期末考试复习资料汇编.pdf(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据预处理 复习题 超越高度温馨提醒:可以使用 word 查找功能快速查找对应题目和答案。查找快捷键:Ctrl+F (一)单选题 1.下列关于缺失值的形式的说法中,正确的是()。APython 中默认的缺失值形式为 NA BPandas 中默认的缺失值形式为 NaN CPython 中默认的缺失值形式为 Null DPandas 中默认的缺失值形式为空字符串()2下列表述中,正确的是()。A对字符串型变量的缺失值,需要使用众数进行填补。B对于缺失值,最简单的处理方法是使用均值进行填补。C完全变量指的包含缺失值的变量。D 在调查过程中,因被调查者拒绝回答敏感问题而造成的数据缺失,属于人为原因。
2、3.关于日期时间型数据,下列说法正确的是()。A在计算机系统中,日期时间型数据是以文本形式存储的。B在计算机系统中,日期时间型数据是以数值形式存储的。C在计算机系统中,日期时间型数据是以因子形式存储的。D在计算机系统中,日期时间型数据是以缺失值形式存储的。4.下图是某分类变量各类别计数分布的箱线图,从图中可知()。A少部分分类计数很低。B该变量类别很少,可以清晰的用箱线图展示各类别的频数。C 这个变量存在大量低频分类。D绝大多数分类计数很高。5.下列关于数据预处理的表述中,不正确的是()。A具备专业经验的数据科学家可以在数据分析前忽略数据预处理。B 数据预处理是在数据采集后,分析前这段时间里对
3、数据进行的处理操作。C数据预处理的效果与数据分析顺利与否直接相关。D数据预处理往往占据数据分析项目总工作量的 60%以上。6.下列数据特征缩放的公式中,正确的是()。A数据中心化公式为:=。B数据标准化公式为:=。CMax-ABS 缩放公式为:=|。DRobust 缩放公式为:=。7.下列关于相关系数的表述中,正确的是()。APearson 相关系数的值在0,1之间分布。BSpearman 相关系数的值在-1,1之间分布。C变量和的 Spearman 相关系数的定义为:=()()()2+()2。D相关系数越大,则说明两个变量的相关性越强。8.下列关于异常值的表述中,不正确的是()。A异常值也可以称为离群值。B异常值的数值可能是真实可靠的。C异常值在数据中占得比例很小。D异常值完全是由于错误形成的数据。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国家 开放 大学 数据 预处理 期末考试 复习资料 汇编
限制150内