(本科)(01)第1章数据与Python语言(Py1)ppt课件.pptx
《(本科)(01)第1章数据与Python语言(Py1)ppt课件.pptx》由会员分享,可在线阅读,更多相关《(本科)(01)第1章数据与Python语言(Py1)ppt课件.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课程主讲人:(01)第1章 数据与Python语言(Py1)第 1 章1 - 2统计学Python实现贾俊平2022-5-132022-5-13PythonPython 实现实现第 1 章1 - 3统计学Python实现贾俊平2022-5-132022-5-13第 1 章1 - 4统计学Python实现贾俊平2022-5-132022-5-13 统计学统计学收集、处理、分析、解释数据并从数据中得出结论的科学 数据与统计学 什么是统计学什么是统计学描述性方法描述性方法研究数据收集、整理和描述的统计学方法描述数据特征,找出数据的基本规律内容包括:数据收集、处理、展示、描述性分析推断性方法推断性方法
2、研究如何利用样本数据来推断总体特征的统计学方法对总体特征作出推断内容包括:参数估计和假设检验第 1 章1 - 5统计学Python实现贾俊平2022-5-132022-5-13l 变量变量(variable)(variable)观察一个企业的销售额,这个月和上个月不同;观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”等就是变量l 数据数据(data)(data)变量的观测结果 数据与统计学 变量和数据变量
3、和数据变量的基本分类变量的基本分类类别变量类别变量(定性变量)(定性变量)无序类别变量无序类别变量(名义值)(名义值)有序类别变量有序类别变量(顺序值)(顺序值)数值变量数值变量(定量变量)(定量变量)离散变量离散变量(有限值)(有限值)连续变量连续变量(无限制)(无限制)第 1 章1 - 6统计学Python实现贾俊平2022-5-132022-5-13l二手数据二手数据l抽取样本抽取样本总体(population):包含所研究的全部个体(或数据)的集合样本(sample):从总体中抽取的一部分元素的集合样本量(sample size):构成样本的元素的数目l概率抽样方法概率抽样方法根据已知
4、的概率抽取样本元素,也称随机抽样 数据与统计学 数据来源数据来源l简单随机抽样简单随机抽样从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有放回抽样和无放回抽样l分层抽样分层抽样将总体单位按某种特征或规则划分为不同层,再从不同的层中随机地抽取样本l系统抽样系统抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本元素l整群抽样整群抽样将总体中若干个单位合并为组(群),抽样时直接抽取群,再对中选群中的所有单位全部实施调查第 1 章1 - 7统计学Py
5、thon实现贾俊平2022-5-132022-5-13 Python的初步使用 PythonPython的下载与安装的下载与安装第 1 章1 - 8统计学Python实现贾俊平2022-5-132022-5-13 Python的初步使用 PythonPython的安装的安装 打开IDEL 在提示符“”后输入命令代码 每次可以输入一条命令,也可以连续输入多条命令,命令之间用分号“ ;”隔开 命令输入完成后,按“Enter”键,Python软件就会运行该命令并输出相应的结果第 1 章1 - 9统计学Python实现贾俊平2022-5-132022-5-13Anaconda包含了多个基本模块,如nu
6、mpy,pandas,matplotlib,IPython等,安装Anaconda时,这些模块也就一并安装好了,Anaconda还内置了Jupyter Notebook开发环境,十分方便代码的编写和修改Anaconda包含了Python,直接安装即可,无序安装Python本书代码编写和运行使用的就是Anaconda平台的Jupyter Notebook界面 Python的初步使用 PythonPython的安装的安装第 1 章1 - 10统计学Python实现贾俊平2022-5-132022-5-13 Python的初步使用 PythonPython的安装的安装第 1 章1 - 11统计学Py
7、thon实现贾俊平2022-5-132022-5-13 Python的初步使用 使用使用Jupyter NotebooJupyter Noteboo编写代码编写代码l 在 i n 后 的 代 码 框 ( 称 为“cell”)中可输入代码。点击“运 行 ” 按 钮 或 使 用 组 合 键,即可运行该代码,运行结果会在代码块的下面显示,其中out 内的数字表示第几次运行输出l 要增加新的代码编辑框,可以点击“+”或“Insert”,可以在上方或下方增加代码编辑框,即可继续编写代码第 1 章1 - 12统计学Python实现贾俊平2022-5-132022-5-13l要保存编写的代码,常用的有两种格
8、式:一种是Jupyter Notebook的专属文件格式,另一种是Python 格式l要保存成Jupyter Notebook格式,在文件界面中点击file菜单,选择Save and Checkpoint,文件会自动保存在默认路径下,文件的扩展名为ipynbl如果要保存在自己的文件夹中,可以在桌面上先建立一个文件夹,比如,Python_code,进入Jupyter Notebook后,点击“Desktop”就能显示你的文件夹Python_code,点击该文件夹,并点击右上角的New按钮,选择Python3,即可以创建一个Python文件,这个文件就会自动保存至文件夹Python_code中l要
9、保存成Python文件,点击file菜单,选择Download as下的Python(.py),文件会自动保存在默认路径下 Python的初步使用 使用使用Jupyter NotebooJupyter Noteboo编写代码编写代码第 1 章1 - 13统计学Python实现贾俊平2022-5-132022-5-13l该界面类似于Rstudiol在Windows开始窗口找到点后在子目录中找到Spyder,点击后即可打开Spyder界面lSpyder界面由多个窗格组成,使用者可根据需要调整位置和大小 Python的初步使用 AnacondaAnaconda的另一个界面的另一个界面第 1 章1 -
10、 14统计学Python实现贾俊平2022-5-132022-5-13lPython中的模块(module)或称为库(package)是指包含Python类、函数等信息的集合,可以看作一个工具包l大部分统计分析和绘图都可以使用已有的Python模块中的函数来实现l一个Python模块中可能包含多个函数,能做多种分析和绘图,对于同一问题的分析或绘图,也可以使用不同模块中的函数来实现,用户可以根据个人需要和偏好选择所用的模块。模块的下载与安装可以在Python中进行,也可以在Anaconda中进行,这取决于你使用是操作平台或环境l在最初安装Python软件时,自带了一序列内置模块,如time,ra
11、ndom,sys,os,json,pickle,shelve,xml,re,logging等l除内置模块外,Python还提供了丰富的开源的第三方模块,统计常用的模块有数值计算模块numpy,数据处理模块pandas,作图模块matplotlib,统计计算模块statistics,统计建模模块statsmodelsl内置模块与第三方模块都需要导入这些模块才能使用其中的函数 Python的初步使用 模块的安装与加载模块的安装与加载第 1 章1 - 15统计学Python实现贾俊平2022-5-132022-5-13lpip工具是Python自带的第三方安装工具,在python安装过程中已经安装完
12、成,无需独立安装。如果安装Python时成功将其加入PATH,就可以在操作系统终端直接使用pip install命令安装第三方模块。Windows系统的操作是,同时按下电脑上的win+R键,在左下角弹出的运行窗口输入“cmd”即可打开终端。MacOS直接打开Terminal即可l使用Anaconda中的conda进行包的管理和环境管理。安装模块需要在Aandonda Prompt中输入命令。点击Windows的“开始”按钮,在Anaconda点击Aandonda Prompt,在打开的界面中输入安装命令即可完成安装。比如,要安装模块pandas,输入conda install 即可完成安装 P
13、ython的初步使用 模块的安装与加载模块的安装与加载第 1 章1 - 16统计学Python实现贾俊平2022-5-132022-5-13 Python的初步使用 查看帮助文件查看帮助文件第 1 章1 - 17统计学Python实现贾俊平2022-5-132022-5-13 Python的初步使用 编写代码脚本编写代码脚本第 1 章1 - 18统计学Python实现贾俊平2022-5-132022-5-13 Python的初步使用 变量命名变量命名l1. 标识符可以由字母、数字、下画线(_)组成,其中数字不能打头。字母并不局限于 26 个英文字母,可以包含中文字符等。l2. Python语言
14、区分大小写,因此 abc 和 Abc 是两个不同的标识符。l3. 标识符不能包含空格。l另外,Python有33个关键字,如表1-1所示。这些关键字在语法中有特定的含义和功能,不能作为变量名andanddeldelglobalglobalnonlocnonlocalalwhilewhileasaselifelifififnotnotwithwithassertassertelseelseimportimportororyieldyieldbreakbreakexpectexpectininpasspassFALSEFALSEclassclassfinallfinally yisisraiser
15、aiseTRUETRUEcontincontinueueforforlambdalambdareturnreturndefdeffromfromNoneNonetrytry第 1 章1 - 19统计学Python实现贾俊平2022-5-132022-5-13l ython3中有6种基本的数据结构或称数据类型,分别是数字数字(number)、字字符串符串(string)、元组元组(tuple)、列表列表(list)、字典字典(dictionary)、集合(set),这6种数据类型通过不同的组成方式和定义可以产生更多的类型l 使用内置函数type()可以查看数据的类型 PythonPython的数
16、据处理的数据处理 PythonPython的基本数据结构的基本数据结构第 1 章1 - 20统计学Python实现贾俊平2022-5-132022-5-13数字数字l数字用于储存数值。Python3支持4种类型的数字,即int(整数类型)、float(浮点类型,即取小数的数字)、bool(布尔类型,是只取True和False两个值的逻辑型数字,也可以用0和1表示)、complex(复数类型)字符串字符串l由数值、字母、下划线组成的遗传字符。可以使用单引号( )、双引号( )或三引号( )指定字符串,使用“+”连接两个字符串元组元组l元组是一维序列,其定长是固定的、不可变的,内容不能修改,通常用
17、“( )”标识,元素之间用“,”分隔 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构第 1 章1 - 21统计学Python实现贾俊平2022-5-132022-5-13列表列表l 列表也是一维序列,与元组不同的是其长度是可变的,它所包含的内容也可以进行修改l 列表中的元素可以是相同类型,也可以是不同类型,元素之间用逗号分隔,使用中括号“ ”或list类型函数可以创建列表 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构列表列表第 1 章1 - 22统计学Python实现贾俊平2022-5-1
18、32022-5-13 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构列表列表创建列表创建列表第 1 章1 - 23统计学Python实现贾俊平2022-5-132022-5-13 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构列表列表列表的操作列表的操作第 1 章1 - 24统计学Python实现贾俊平2022-5-132022-5-13字典字典l 字典是Python最重要的内置结构之一,它是大小可变的键值对集,其中键(key)和值(value)都是Python对象l 字典中的元素用大括号
19、括起来,用“:”分割键和值,不同的键值组合之间用“,”分隔l 用大括号“ ”或dict函数可以创建字典,其形式如下:dictionary=key1:value1,key2:value2, # 或者写成:dictionary=dict(key1=value1,key2=value2,)l 与列表类似,字典也有很多操作方法 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构字典字典第 1 章1 - 25统计学Python实现贾俊平2022-5-132022-5-13 PythonPython的数据处理的数据处理 PythonPython的基本数据结构
20、的基本数据结构字典字典字典的操作字典的操作第 1 章1 - 26统计学Python实现贾俊平2022-5-132022-5-13集合集合l 集合是由唯一元素组成的无序集,可看成是只有键没有值的字典l 集合中的元素是无序的,不记录元素的位置,因此不支持索引、切片等类似序列的操作,只能遍历或使用in、not in等访问或判断集合元素l 使用set()函数或大括号“ ”的方式等可以创建集合,一个空集合必须使用set()创建 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构集合集合第 1 章1 - 27统计学Python实现贾俊平2022-5-1320
21、22-5-13 PythonPython的数据处理的数据处理 PythonPython的基本数据结构的基本数据结构集合集合集合的操作集合的操作第 1 章1 - 28统计学Python实现贾俊平2022-5-132022-5-13数组数组lnumpy是numerical python的简称,它是Python中数值计算的最重要的基础模块。其他一些模块也都提供了基于numpy的函数功能ln维数组(ndarray)是numpy模块中定义的对象,它可以是一维、二维和多维,数组中元素类型是数值型ln维数组由实际数据和描述这些数据的元数据(数据维度,数据类型等)组成,一般要求所有元素类型相同,数组下标从0开
22、始l一维数组就是通常所说的向量(vector),二维数组就是通常所说的矩阵。可以通过构造函数array创建n维数组,也可以使用numpy中的其他函数如arange函数、ones函数以及zeros函数等创建n维数组 PythonPython的数据处理的数据处理 numpynumpy中的数组中的数组第 1 章1 - 29统计学Python实现贾俊平2022-5-132022-5-13 PythonPython的数据处理的数据处理 numpynumpy中的数组中的数组数组的操作数组的操作a1: 5 4 1 2 3a1: 5 4 1 2 3a2: 0 1 2 3 4 5 6 7 8 9a2: 0 1
23、2 3 4 5 6 7 8 9a3: 2. 2.5 3. 3.5 4. 4.5 5. 5.5a3: 2. 2.5 3. 3.5 4. 4.5 5. 5.5array(1, 2,array(1, 2, 3, 4, 3, 4, 5, 6) 5, 6)第 1 章1 - 30统计学Python实现贾俊平2022-5-132022-5-13 PythonPython的数据处理的数据处理 numpynumpy中的数组中的数组数组的操作数组的操作array( 0, 1, 2, 3,array( 0, 1, 2, 3, 4, 5, 6, 7, 4, 5, 6, 7, 8, 9, 10, 11) 8, 9, 1
24、0, 11)注:注:intint表示整数,如表示整数,如int32int32表示表示3232数位整数;数位整数;int64int64表示表示6464数位整数。数位整数。floatfloat表示浮点数,如表示浮点数,如float32float32(代码:(代码:f4f4或或f f)表示标准单精度浮点数;)表示标准单精度浮点数;float64float64(代码:(代码:f8f8或或d d)表示标准双精度浮点数;)表示标准双精度浮点数;float128float128(代码:(代码:f16f16或或g g)表示拓)表示拓展精度浮点数。展精度浮点数。第 1 章1 - 31统计学Python实现贾俊平
25、2022-5-132022-5-13序列序列lpandas是Python中的核心数据分析库,它提供了两种数据结构,即序列(serise)和数据框(data frame)。这里主要介绍序列和数据框的创建及其一些简单操作l序列类似于一维数组,不同的是它由索引(ndex)和一维数值(values)组成l序列可以储存整数、浮点数、字符、Python对象等多种类型的数据,但一个序列最好只存储一种类型的数据,若存在多种数据类型,该序列的类型会自动转换成对象(object)l使用构造函数Series函数可创建序列,使用前需要导入pandas库 PythonPython的数据处理的数据处理 pandaspan
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科01第1章 数据与Python语言Py1ppt课件 本科 01 数据 Python 语言 Py1 ppt 课件
限制150内