第3章描述统计量分析(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx
-
资源ID:88334946
资源大小:2.39MB
全文页数:20页
- 资源格式: PPTX
下载积分:10金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
第3章描述统计量分析(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx
第3章 描述统计量分析(DA)教学课件数据分析基础基于Python的实现 电子教案第 1 章1-2统计学Python实现贾俊平2023/4/162023/4/16贾俊平俊平2023/4/162023/4/16数据分析基础数据分析基础贾俊平俊平 2023/4/162023/4/16Fundamentals of data Fundamentals of data analysis with Pythonanalysis with Python基于基于 Python 的实现的实现第 3 章3-3数据分析基础基于Python的实现2023/4/162023/4/16贾俊平俊平2023/4/162023/4/163.1 3.1 描述水平的统计量描述水平的统计量 3.2 3.2 描述差异的统计量描述差异的统计量 3.3 3.3 描述分布形状的统计量描述分布形状的统计量3.4 3.4 数据的综合描述数据的综合描述 第 3 章 描述统计量分析第 3 章3-4数据分析基础基于Python的实现2023/4/162023/4/16 3.1 描述水平的统计量描述水平的统计量描述水平的统计量平均值平均值简单简单平均数平均数平均数平均数加加加加权权平均数平均数平均数平均数#简单平均数:80.0#加权平均数:81.0第 3 章3-5数据分析基础基于Python的实现2023/4/162023/4/16 3.1 描述水平的统计量描述水平的统计量描述水平的统计量分位数分位数中位数中位数l分分位位数数一组数据按从小到大排序后,可以找出排在某个位置上的数值,该数值可以代表数据水平的高低。这些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等l中中位位数数排序后处于中间位置上的值。不受极端值影响。具有稳健健性性或鲁棒性棒性(robustness)位置确定位置确定位置确定位置确定数数数数值计值计算算算算#计算算3030名学生考名学生考试分数的中位数分数的中位数中位数:85.0第 3 章3-6数据分析基础基于Python的实现2023/4/162023/4/16 3.1 描述水平的统计量描述水平的统计量描述水平的统计量分位数分位数四分位数四分位数l一组数据排序后处在25%和75%位置上的数值。它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上和75%位置上的两个数值PythonPython默默默默认认的位置确定公式的位置确定公式的位置确定公式的位置确定公式#【例3-5】第 3 章3-7数据分析基础基于Python的实现2023/4/162023/4/16 3.1 描述水平的统计量描述水平的统计量描述水平的统计量分位数分位数百分位数百分位数l用99个点将数据分成100等份,处在各分位点上的数值就是百分位数。百分位数提供了各项数据在最小值和最大值之间分布的信息PythonPython默默默默认认的位置确定公式的位置确定公式的位置确定公式的位置确定公式#计算算3030名学生考名学生考试分数的百分位数分数的百分位数第 3 章3-8数据分析基础基于Python的实现2023/4/162023/4/16 3.1 描述水平的统计量描述水平的统计量描述水平的统计量众数众数l一组数据中出现次数最多的变量值l一组数据可能没有众数或有几个众数l实际中很少使用#计算30名学生考试分数的众数众数=86第 3 章3-9数据分析基础基于Python的实现2023/4/162023/4/16 3.2 描述差异的统计量描述差异的统计量描述差异的统计量极差和四分位差极差和四分位差l极差:一组数据的最大值与最小值之差l四分位差:上四分位数与下四分位数之差#计算30名学生考试分数的极差和四分位差#极差=47#四分位差:IQR=19.5第 3 章3-10数据分析基础基于Python的实现2023/4/162023/4/16 3.2 描述差异的统计量描述差异的统计量描述差异的统计量方差和标准差方差和标准差l方差:各变量值与均值的平均差异l标准差:方差的平方根样本样本标准差标准差s s#计算30名学生考试分数的方差和标准差方差:174.6206896551724#标准差标准差:13.21第 3 章3-11数据分析基础基于Python的实现2023/4/162023/4/16 3.2 描述差异的统计量描述差异的统计量描述差异的统计量变异系数变异系数(CV)l标准差与其相应的均值之比l对数据相对离散程度的测度l用于比较不同系列数据的离散程度计算公式计算公式【例【例3-9】(数据:example2_3.csv)沿用第2章的例2-3。计算6个城市AQI的平均数、标准差和变异系数,比较AQI离散程度的大小第 3 章3-12数据分析基础基于Python的实现2023/4/162023/4/16 3.2 描述差异的统计量描述差异的统计量描述差异的统计量标准分数标准分数l对某一个值在一组数据中相对位置的度量,也称标准化值l可用于判断一组数据是否有离群点(outlier)计算公式计算公式#【例例310310】计算例3-1的标准分数标准分数:0.3784-1.8919 0.8324-1.0594-0.0757 1.2865 0.9081-1.8919 0.5297 0.7567 0.227 -0.7567 1.2108-0.6054 0.7567-1.4378 0.454 0.454 0.9081 0.3784-0.9838 0.0757 0.6811-2.2702 1.1351 0.454 -0.3784 0.8324 0.1513-1.0594第 3 章3-13数据分析基础基于Python的实现2023/4/162023/4/16 3.3 描述分布形状的统计量描述分布形状的统计量描述分布形状的统计量偏度系数偏度系数计算公式计算公式#计算偏度系数算偏度系数偏度系数:-0.8314第 3 章3-14数据分析基础基于Python的实现2023/4/162023/4/16 3.3 描述分布形状的统计量描述分布形状的统计量描述分布形状的统计量峰度系数峰度系数例题分析例题分析l峰度(kurtosis)是指数据分布峰值的高低l由统计学家K.Pearson于1905年首次提出l峰峰度度系系数数测度一组数据分布峰 值 高 低 的 统 计 量 是(coefficient of kurtosis),记作K计算公式计算公式#计算峰度系数峰度系数:-0.3515第 3 章3-15数据分析基础基于Python的实现2023/4/162023/4/16 3.4 数据的综合和描述数据的综合和描述数据的综合描述数据的综合描述例题分析例题分析【例例3-9】6名 运动员的涉及成绩使用使用pastecspastecs包中的包中的stat.descstat.desc函数计算描述统计量函数计算描述统计量第 3 章3-16数据分析基础基于Python的实现2023/4/162023/4/16 3.4 数据的综合和描述数据的综合和描述数据的综合描述数据的综合描述例题分析例题分析图形描述图形描述【例例312】60个大学生的调查数据图形分析分分布布特特征征的的图图示示第 3 章3-17数据分析基础基于Python的实现2023/4/162023/4/16 3.4 数据的综合和描述数据的综合和描述数据的综合描述数据的综合描述例题分析例题分析图形描述图形描述【例例312】60个大学生的调查数据图形分析分分布布特特征征的的图图示示第 3 章3-18数据分析基础基于Python的实现2023/4/162023/4/16 3.4 数据的综合和描述数据的综合和描述数据的综合描述数据的综合描述例题分析例题分析统计量描述统计量描述七年性别分组统计频数七年性别分组统计频数计算全部学生的描述统计量计算全部学生的描述统计量按性别和家庭所在地分组按性别和家庭所在地分组第 3 章3-19数据分析基础基于Python的实现2023/4/162023/4/16 3.4 数据的综合和描述数据的综合和描述数据的综合描述数据的综合描述例题分析例题分析统计量描述统计量描述根据需要自编函数计算描述统计量根据需要自编函数计算描述统计量THE ENDTHE ENDT THHAANNKKS S2023/4/16人人 生生 苦苦 短短我我 用用P Py yt th ho on n