Python数据分析与应用_从数据获取到可视化题库及答案课后习题_答案.docx
《Python数据分析与应用_从数据获取到可视化题库及答案课后习题_答案.docx》由会员分享,可在线阅读,更多相关《Python数据分析与应用_从数据获取到可视化题库及答案课后习题_答案.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Python数据分析与应用_从数据获取到可视化题库及答案课后习题_答案第1章一、 填空题1. 数据分析2. Anaconda3. 实时二、 判断题1. 错2. 对3. 错三、 选择题1. B2. C3. D4. C四、 简答题1. 数据分析是指,用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。2. 明确目的和思路、数据收集、数据处理、数据分析、数据展现。3. (1)语法简单精炼,适合初学者入门;(2)拥有一个巨大且活跃的科学计算社区;(3)拥有强大的通用编程能力;(4)人工智能时代的通用语言;(5)方便对接其它语言。第2章一、 填空题
2、1. ndarray2. 二维3. 位长4. 广播5. 数组或列表二、 判断题1. 错2. 对3. 对4. 对5. 错三、 选择题1. B2. D3. A4. C5. A四、 简答题1. 答案:NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作,这个过程叫做矢量化运算。2. 答案:两个数组的某一维度等长,或其中一个数组为一维数组。五、 程序题1. 答案:import numpy as nparr = np.zeros(5)print(arr)2. 答案:import numpy as nparr = np.zeros(8,8),dtype=int)arr1:2,:2 = 1ar
3、r:2,1:2 = 1print(arr)第3章一、 填空题1. Numpy2. Series DataFrame3. 索引 数据4. 列表 字典5. 按置排序 按索引排序二、 判断题1. 对2. 对3. 错4. 错5. 错三、 选择题1. A2. B3. A4. A5. B四、 简答题1. Series是一个类似于一维数组的对象,它能够保存任何类型的数据,主要由一组数据和与之相关的索引两部分构成。DataFrame是一个类似于二维数组的对象,它每列的数据可以是不同的数据类型。DataFrame的结构也是由索引和数据组成的,并且DataFrame的索引有行索引和列索引。2. 层次化索引是在单层
4、索引的基础上进行延伸,它可以在一个轴上存在多层索引,并且能够以低纬度形式表示高维度的数据。五、 程序题(1) 答案:import numpy as npimport pandas as pddf_data = np.array(1, 5, 8, 8, 2, 2, 4, 9, 7, 4, 2, 3, 3, 0, 5, 2) # 创建数组col_data = np.array(A, B, C, D) # 创建数组# 基于数组创建DataFrame对象df_obj = pd.DataFrame(columns=col_data, data=df_data) df_obj(2) 答案:sort_val
5、ues_data = df_obj.sort_values(by=B, ascending=False)sort_values_data(3) 答案:sort_values_data.to_csv(rE:数据分析write_data.csv)写入完毕第4章一、 填空题1. 完整性 唯一性 权威性 合法性 一致性2. 人为原因 机械原因3. 列索引 行索引4. 横向堆叠 纵向堆叠 内连接 外连接5. 正态分布二、 判断题1. 对2. 错3. 对4. 错5. 错三、 选择题1. B2. A3. C4. D5. A四、 简答题1. 在数据预处理的过程中会根据数据的实际情况选择合适处理方法,常用的预处
6、理操作有数据清洗、数据合并、数据重塑、数据转换等,在这几种操作中又分别含有不同的数据处理方法,例如在数据清洗过程中含有空值和缺失的检测、重复值的处理、异常值的处理等。2. 在Pandas中常用的数据合并操作有:concat()函数表示沿着一条轴将多个对象进行堆叠、merge()函数表示根据一个或多个键将不同的对象进行合并、join()方法表示根据索引或指定的列来合并数据、combine_first()方法表示填充合并数据。五、 程序题(1) 答案:import pandas as pdimport numpy as npgroup_a = pd.DataFrame(A: 2,3,5,2,3,
7、B: 5,np.nan,2,3,6, C: 8,7,50,8,2, key: 3,4,5,2,5)group_b = pd.DataFrame(A: 3,3,3, B: 4,4,4, C: 5,5,5)print(group_a)print(group_b)(2) 答案:group_a = group_bine_first(group_b)group_a(3) 答案:group_a.rename(columns=key:D)第5章一、 填空题1. 拆分 应用 合并2. 列表或数组 DataFrame对象某列的名称 字典或Series对象 函数3. 广播4. DataFrameGroupBy二、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 数据 分析 应用 获取 可视化 题库 答案 课后 习题
限制150内