Python数据分析与应用_从数据获取到可视化题库及答案课后习题.docx
《Python数据分析与应用_从数据获取到可视化题库及答案课后习题.docx》由会员分享,可在线阅读,更多相关《Python数据分析与应用_从数据获取到可视化题库及答案课后习题.docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Python数据分析与应用_从数据获取到可视化题库及答案课后习题第1章习题一、 填空题1. 的目的在于将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据。2. 中包含了conda、Python在内的超过180个科学包及其依赖项。3. Jupyter Notebook是一个支持 代码、数学方程、可视化和Markdown的Web应用程序。二、 判断题1. 数据分析是一个有目的地收集和整合数据的过程。( )2. Python是一门胶水语言,可以轻松地操作其它语言编写的库。( )3. 如果要卸载指定环境中的包,则直接使用remove命令移除即可。( )三、 选择题1. 下列选项中,用于搭接数据
2、仓库和保证数据质量的是( )。A. 数据收集 B. 数据处理C. 数据分析D. 数据展现2. 关于Anaconda的说法中,下列描述错误的是( )。A. Anaconda是一个可以对包和环境进行统一管理的发行版本。B. Anaconda包含了conda、Python在内的超过180个科学包及其依赖项C. Anaconda是完全开源的、付费的D. Anaconda避免了单独安装包时需要配置或兼容等各种问题3. 关于Anaconda的组件中,可以编辑文档且展示数据分析过程的是( )。A. Anaconda NavigatorB. Anaconda PromptC. SpyderD. Jupyter
3、 Notebook4. 下面列出的数据分析库中,用于绘制数组的2D图形的是( )。A. NumPyB. PandasC. MatplotlibD. NLTK四、 简答题1. 什么是数据分析?2. 请简述数据分析的基本过程。3. Python做数据分析有哪些优势?第2章习题一、 填空题1. 在NumPy中,可以使用数组对象_执行一些科学计算。2. 如果ndarray.ndim执行的结果为2,则表示创建的是_维数组。3. NumPy的数据类型是由一个类型名和元素_的数字组成。4. 如果两个数组的大小(ndarray.shape)不同,则它们进行算术运算时会出现_机制。5. 花式索引是NumPy的一
4、个术语,是指用整数_进行索引。二、 判断题1. 通过empty()函数创建的数组,该数组中没有任何的元素。( )2. 如果没有明确地指明数组中元素的类型,则默认为float64。( )3. 数组之间的任何算术运算都会将运算应用到元素级。( )4. 多维数组操作索引时,可以将切片与整数索引混合使用。( )5. 当通过布尔数组索引操作数组时,返回的数据是布尔数组中False对应位置的值。( )三、 选择题1. 下列选项中,用来表示数组维度的属性是( )。A. ndimB. shapeC. sizeD. dtype2. 下面代码中,创建的是一个3行3列数组的是( )。1. arr = np.arra
5、y(1, 2, 3)2. arr = np.array(1, 2, 3, 4, 5, 6)3. arr = np.array(1, 2, 3, 4)4. np.ones(3, 3)3. 请阅读下面一段程序:arr_2d = np.array(11, 20, 13,14, 25, 16,27, 18, 9)print(arr_2d1, :1)执行上述程序后,最终输出的结果为( )。A. 14B. 25C. 14, 25D. 20, 254. 请阅读下面一段程序:arr = np.arange(6).reshape(1, 2, 3)print(arr.transpose(2, 0, 1)执行上述程
6、序后,最终输出的结果为( )。A.2 50 31 4B. 1 4 0 3 2 5C.0 31 42 5D. 0 31 42 55. 下列函数或方法中,用来表示矢量化三元表达式的是( )。A. where()B. cumsum()C. sort()D. unique()四、 简答题1. 什么是矢量化运算?2. 实现数组广播机制需要满足哪些条件?五、 程序题1. 创建一个数组,数组的shape为(5,0),元素都是0。2. 创建一个表示国际象棋棋盘的8*8数组,其中,棋盘白格用0填充,棋盘黑格用1填充。第3章习题一、 填空题1. Pandas是一个基于 的Python库。2. Pandas中有两个
7、主要的数据结构分别为 和 。3. Series结构由 和 组成。4. 可以使用 和 创建一个Series对象。5. 数据排序可以分为 和 。二、 判断题1. 在DataFrame中每列的数据都可以看做是一个Series对象。( )2. 使用describe()方法会输出多个统计指标。( )3. from_arrays()方法是将元组列表转换为MultiIndex对象。( )4. read_csv()函数和read_table()函数没有区别可以随意替换使用。( )5. Series对象不存在层次化索引。( )三、 选择题1. 下列选项中,描述不正确的是( )。A. Pandas中只有Serie
8、s和DataFrame这两种数据结构B. Series是一维的数据结构C. DataFrame是二维的数据结构D. Series和DataFrame都可以重置索引2. 下列选项中,描述正确是( )。A. Series是一维数据结构,其索引在右,数据在左B. DataFrame是二维数据结构,并且该结构具有行索引和列索引C. Series结构中的数据不可以进行算术运算D. sort_values()方法可以将Series或DataFrame中的数据按照索引排序3. 下列方法中,可以将元组转换为MultiIndex对象的是( )。A. from_tuples()B. from_arrays()C.
9、 from_product()D. from_list()4. 下列选项中,哪个方法可以一次性输出多个统计指标( )。A. describe()B. mean()C. median()D. sum()5. 请阅读下面一段程序:import pandas as pdser_obj = pd.Series(range(1, 6), index=5, 3, 0, 4, 2)ser_obj.sort_index()执行上述程序后,最终输出的结果为( )。A.5 13 20 34 42 5B.0 32 53 24 45 1C.5 14 43 22 50 3D.2 54 40 33 25 1四、 简答题1
10、. 简述Series和DataFrame的特点。2. 简述什么是层次化索引。五、 程序题1. 现有如下图所示的数据,请对该数据进行以下操作:(1) 使用DataFrame创建该数据。(2) 将图中的B列数据进行按降序排序。(3) 将排序后的数据写入到csv文件,并命名为write_data.csv。第4章习题一、 填空题1. 数据清洗的目的是让数据具有 、 、 、 、 、等特点。2. 产生缺失值或空值的原因有 和 。3. stack()方法可以将 转换为 。 4. concat()函数的堆叠方式有 和 ,连接方式有 和 。5. 拉依达原则在检测异常值时必须保证数据遵守 。二、 判断题1. re
11、name()方法可以重命名索引名。( )2. drop_duplicated()方法可以删除重复值。( )3. 在箱形图中超出上界和下界的值称为异常值。( )4. 当一个具有多层次索引的DataFrame对象经过stack()后,会返回一个Series对象。( )5. 在使用merge()函数进行合并时,不需要指定合并键。( )三、 选择题1. 下列选项中,描述不正确的是。( )A. 数据清洗的目的是为了提高数据质量B. 异常值一定要删除C. 可使用drop_duplicates()方法删除重复数据D. concat()函数可以沿着一条轴将多个对象进行堆叠2. 请阅读下面一段程序:from p
12、andas import Seriesimport pandas as pdfrom numpy import NaNseries_obj = Series(None, 4, NaN)pd.isnull(series_obj)执行上述程序后,最终输出的结果为( )。A.0 True1 False2 TrueB.0 True1 True2 FalseC.0 False1 True2 TrueD.0 True1 True2 True3. 下列选项中,可以删除缺失值或空值的是。( )A. isnull()B. notnull()C. dropna()D. fillna()4. 下列选项中,描述不正确
13、是。( )A. concat()函数可以沿着一条轴将多个对象进行堆叠B. merge()函数可以根据一个或多个键将不同的DataFrame进行合并C. 可以使用rename()方法对索引进行重命名操作D. unstack()方法可以将列索引旋转为行索引5. 请阅读下面一段程序:import numpy as npimport pandas as pdser_obj = pd.Series(4, np.nan, 6, 5, -3, 2)ser_obj.sort_values()执行上述程序后,最终输出的结果为( )。A.4 -3.05 2.00 4.03 5.02 6.01 NaNB.1 NaN
14、2 6.03 5.00 4.05 2.04 -3.0C.5 2.00 4.03 5.02 6.04 -3.01 NaND.0 4.01 NaN2 6.03 5.04 -3.05 2.0四、 简答题1. 请简述数据预处理的常用操作。2. 常用的数据合并操作有哪些?五、 程序题1. 现有如下图所示的两组数据,其中 A组中B列数据存在缺失值,并且该列数据为int类型,B组中的数据均为str类型。接下来,请对这些数据进行以下操作:(1) 使用DataFrame创建这两组数据。(2) 现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。(3) 将合并后A组中索引名为key的索引重命名为D
15、。第5章习题一、 填空题1. 分组聚合的流程分为 、 、 。2. 分组键的形式可以有 、 、 、 。 3. transform()方法会对产生的标量值进行 操作。4. 当对一个DataFrame对象进行分组后会返回一个 对象。二、 判断题1. 分组聚合的原理一般分为拆分-应用-合并。( )2. 只要使用groupby()方法分组就会产生一个DataFrameGroupby对象。( )3. 使用agg()方法进行聚合运算会对产生的标量值进行广播。( )4. 使用transform()方法进行聚合运算,其结果可以保持与原数据形状相同。( )5. apply()方法可以使用广播功能。( )三、 选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 数据 分析 应用 获取 可视化 题库 答案 课后 习题
限制150内