Python数据分析与可视化教案6.1 成绩数据预处理与分析.docx
《Python数据分析与可视化教案6.1 成绩数据预处理与分析.docx》由会员分享,可在线阅读,更多相关《Python数据分析与可视化教案6.1 成绩数据预处理与分析.docx(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.1成绩数据预处理与分析学生成绩是表达学生学习能力水平的重要数据之一。如何从各学期、各科目的大量学 生成绩中快速准确读取分析学生的综合能力,成为学校各项工作的重要数据支持。一、数据源本案例以某年级1班到5班的数学、语文、英语、计算机四门学科的期末成绩为例, 对其进行数据分析,数据文件为score.xls,如图6-*所示。白X剪切 粘贴力复制,-y格式刷剪贴板宋体B / U 字体11 -n晨 笠.三三三涉,哥自动换行室春建运运幽合并后居中,对齐方式Q常规N38 GA性别A开始 插入 页面布局 公式 数据 审阅 视图文件12345678910111213141592101921029210392
2、104921059210692107921089210992110921119211292113161718192021222324 OCT92114921159211692117921189211992120921219212292123男男男女女女女女男女男男地区数学语文英语计算机江苏-无锡85313465安徽-黄山70462150安徽-芜湖90848292江苏-南京94855190江苏-连云港82886185山东-潍坊80856192江苏-南京87784193四川-成都92716185江苏-苏州87755275山东-济南76776587江苏-盐城86595087江苏-苏州92739271
3、安徽-黄山 88689083BCD E F G H女女出班2江苏-常州 四川-成都 江苏-盐城 江苏-苏州 安徽-合肥 江苏-常州 安徽-芜湖 江苏-常州 江苏-无锡 江苏-盐城,_,卜在学住二 3班4班5班均928587778193988791923n815678625457537851488592938561413966533290838781796777697268图6-*数据源二、要求1 .查询语文和英语都较好的同学。2 .根据四科成绩,计算总分,对总分进行排名,查看名次的大概情况。3 .计算总分的平均分和中位数,并进行比拟。4 .计算江苏省学生四门学科的平均分,并加以比拟。5 .根据
4、总分生成总分段,并分析哪个总分段的比例最高。6 .总分等级为C的学生中,计算不同城市学生的平均分,并加以比拟。三、步骤步骤1 :导入库,设置参数。导入所需要的库pandas,利用pd.set_option解除显示宽 度的显示,设置数据对齐。步骤1代码如下:import pandas as pdpd.set_option(display.width,None)pd.seCoptionCdisplay.unicode.easLasian-WidthTrue)步骤2:数据拼接。利用循环语句分别导入1班、2班、3班、4班、5班的数据,并 利用append将其合并为一个数据,命名为data,并查看数据的
5、行数、列数和列名。步骤2代码如下:data = pd.read_excel(nc:/data/score.xlsn,sheet_name=0)for i in range(l,5):data_append = pd.read_excel(nc:/data/score.xls,sheet_name=i) print(data_append)data = data.append(data_append,ignore_index=True)输出结果如图6-*所不。Run:6-1C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProj
6、ects/sjfx/6-1.py数据的行数=300 数据的列数=7部 三 数据的所有列名为:index(学号,性别,地区,数学,语文,英语,计算机dtype=object)*” Process finished with exit code 0图6-*步骤2输出结果步骤3 :数据查询。(1)查询数据学号与四门学科的前5行。(2)查询语文和英语都大于90分的数据。步骤3 (1)代码如下:print(data学号,嗷学?语文?英语?计算机皿:5)输出结果如图6-*所不。Run:6-1C:UsersliliangAnaconda3python.exe C:/Users/liliang/Pycharm
7、Projects/sjfx/6-1.py学号数学语文英语计算机09210185313465I=519210270462150292103908482923921049485519049210582886185Process finished with exit code 0图6-*步骤3 (1)输出结果步骤3 (1)代码如下:print(data.loc(data语文】85) & (data英语85)输出结果如图6-*所不。Run:6-1 个 C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/6-l.
8、py学号性别地区数学语文英语计算机3292133女江苏连云港828893856592206男安徽-合肥878690746892209女江苏-连云港8386938210292243男四川-成都8186866113092311男江苏-盐城5986908713292313女安徽-黄山6888928313392314男江苏-常州8292939015092331男安徽-芜湖84909392Process finishedwith exitcode 0图6-*步骤3 (2)输出结果步骤4 :添加新列。(1)生成新列“总分”,计算公式为:总分=数学+语文+英语+计算机。(2)将“地区”列拆分为两列,分别命名
9、为“省”、“城市”。步骤4 (1)代码如下:data总分=data数学】+ data语文】+ data英语+ data计算机】步骤4 (2)代码如下:data省=data/地区.str. split,,expand=True)Odata/城市=data,fbX.str.split(,-,expand=True)lprint(data.head()输出结果如图6-*所不。Run:6-1C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/6-1.py0学号性别地区 江苏-无锡数学85语文英语计算机总分65省
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python数据分析与可视化 教案 6.1 成绩数据预处理与分析 Python 数据 分析 可视化 成绩 预处理
限制150内