教学课件(04)第4章数据的描述分析(Excel-1).pptx
-
资源ID:27145710
资源大小:3.31MB
全文页数:27页
- 资源格式: PPTX
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
教学课件(04)第4章数据的描述分析(Excel-1).pptx
教材配套资源页完整PPT课件教学课件(04)第4章 数据的描述分析(Excel-1)4 - 22022-7-22数据分析基础Excel实现(贾俊平)课程结构第1章 数据分析概述第2章 数据处理第3章 数据可视化分析第4章 数据的描述分析第5章 推断分析基本方法第6章 相关与回归分析第7章 时间序列分析4 - 32022-7-22数据分析基础Excel实现(贾俊平)4 - 42022-7-22数据分析基础Excel实现(贾俊平)l 学习目标学习目标掌握各描述统计量的特点和应用场合使用Excel的统计函数和数据分析工具计算各描述统计量利用各统计量分析数据并能对结果进行合理解释l 思政目标思政目标数据的描述性分析主要是利用各种统计量来概括数据的特征。描述性分析中,要根据各统计量的特点和应用条件进行合理使用和分析描述性分析要结合我国的宏观经济和社会数据,分析社会和经济发展的成就和公平与合理程度,避免以偏概全等不恰当应用学习目标和思政目标4 - 52022-7-22数据分析基础Excel实现(贾俊平) 数据水平的描述4 - 62022-7-22数据分析基础Excel实现(贾俊平)【例【例4-1】随机抽取30个大学生,得到他们在“双十一”期间的网购金额数据,如表所示。计算30个人的平均网购金额479.0721.2672.4728.7443.2381.3527.0500.0586.0500.0528.2633.8705.9423.5590.1353.6447.4565.3557.1481.3561.1620.1477.1436.2562.9505.1515.4502.7487.5675.4 数据水平的描述4 - 72022-7-22数据分析基础Excel实现(贾俊平)【例【例4-2】假定将表4-1的数据分成组距为50的组,分组结果如表4-2所示,计算网购金额的平均数分组分组人数人数35040024004504450500450055075506006600650265070027007503合计合计30分组分组350400375275040045042541700450500475419005005505257367555060057563450600650625212506507006752135070075072532175合计合计3016250 数据水平的描述4 - 82022-7-22数据分析基础Excel实现(贾俊平)分位数分位数一组数据按从小到大排序后,可以找出排在某个位置上的数值,该数值可以代表数据水平的高低。这些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等中位数中位数排序后处于中间位置上的值。不受极端值影响 数据水平的描述4 - 92022-7-22数据分析基础Excel实现(贾俊平)四分位数四分位数l一组数据排序后处在25%和75%位置上的数值l它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据l中间的四分位数就是中位数,通常所说的四分位数是指处在25%位置上和75%位置上的两个数值 数据水平的描述4 - 102022-7-22数据分析基础Excel实现(贾俊平) 数据水平的描述4 - 112022-7-22数据分析基础Excel实现(贾俊平)百分位数百分位数(percentile)l是用99个点将数据分成100等分,处于各分位点上的数值就是百分位数l百分位数提供了各项数据在最小值和最大值之间分布的信息中间的四分位数就是中位数,通常所说的四分位数是指处在25%位置上和75%位置上的两个数值l使用Excel中的【PERCENTILE.INC】函数可以计算任意一个百分位数。该函数的格式为:PERCENTILE.INC(array,k),其中array计算百分位数的数组或数据区域,K为第 K 个百分点的值,取值在0到1之间,包含0和1 数据水平的描述4 - 122022-7-22数据分析基础Excel实现(贾俊平) 数据水平的描述4 - 132022-7-22数据分析基础Excel实现(贾俊平) 数据水平的描述4 - 142022-7-22数据分析基础Excel实现(贾俊平)平均数平均数易受极端值影响数学性质优良,实际中最常用数据对称分布或接近对称分布时代表性较好中位数中位数不受极端值影响数据分布偏斜程度较大时代表性接好众数众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时代表性较好 数据水平的描述4 - 152022-7-22数据分析基础Excel实现(贾俊平) 数据差异的描述4 - 162022-7-22数据分析基础Excel实现(贾俊平) 数据差异的描述4 - 172022-7-22数据分析基础Excel实现(贾俊平)方差方差各变量值与均值的平均差异标准差标准差上四分位数与下四分位数之差 数据差异的描述4 - 182022-7-22数据分析基础Excel实现(贾俊平)【例【例4-8】沿用例4-2。根据表4-2的分组数据,计算网购金额的标准差 数据差异的描述分组分组350400375227777.7955555.58400450425413611.1254444.4845050047544444.4517777.805005505257277.781944.4555060057561111.116666.6560065062526944.4413888.88650700675217777.7735555.54700750725333611.10100833.30合计合计30105555.55286666.674 - 192022-7-22数据分析基础Excel实现(贾俊平)l离散系数离散系数标准差与其相应的均值之比l对数据相对离散程度的测度l消除了数据水平高低和计量单位的影响l用于对不同组别数据离散程度的比较l计算公式为【 例例4-9】 为分析不同行业上市公司每股收益的差异,在互联网服务行业和机械制造行业各随机抽取10家上市公司,得到某年度的每股收益数据如表4-5所示。比较两类上市公司每股收益的离散程度 数据差异的描述互联网公司互联网公司机械制造公司机械制造公司0.320.680.470.430.890.280.970.030.870.421.090.240.730.660.960.290.960.020.630.59统计量统计量互联网公司互联网公司机械制造公司机械制造公司平均数平均数0.7890.364标准差标准差0.2470020.236606离散系数离散系数0.3130570.6500154 - 202022-7-22数据分析基础Excel实现(贾俊平)l标准分数也称标准化值l对某一个值在一组数据中相对位置的度量l可用于判断一组数据是否有离群点(outlier)l用于对变量的标准化处理l计算公式为 数据差异的描述4 - 212022-7-22数据分析基础Excel实现(贾俊平)【 例例4-10】沿用例4-1。计算30个人网购金额的标准分数网购金额网购金额标准分数标准分数网购金额网购金额标准分数标准分数网购金额网购金额标准分数标准分数479.0-0.6141672.41.3670443.2-0.9808527.0-0.1224586.00.4820528.2-0.1101705.91.7102590.10.5240447.4-0.9378557.10.1859561.10.2269477.1-0.6336562.90.2453515.4-0.2412487.5-0.5270721.21.8669728.71.9438381.3-1.6149500.0-0.3990500.0-0.3990633.80.9716423.5-1.1826353.6-1.8987565.30.2699481.3-0.5906620.10.8313436.2-1.0526505.1-0.3468502.7-0.3713675.41.3978 数据差异的描述4 - 222022-7-22数据分析基础Excel实现(贾俊平)l峰度峰度(kurtosis)指数据分布峰值的高低l由统计学家K.Pearson于1905年首次提出l峰度系数峰度系数测度一组数据分布峰值高低的统计量是(coefficient of kurtosis),记作Kl计算公式 数据形状的描述4 - 232022-7-22数据分析基础Excel实现(贾俊平) 数据形状的描述4 - 242022-7-22数据分析基础Excel实现(贾俊平)【例【例4-12】沿用例4-9。计算互联网服务行业和机械制造行业上市公司每股盈的各描述统计量,并进行综合分析Excel实现实现第1步:将光标放在任意空白单元格。然后点击【数据】【数据分析】。在分析工具中选择【描述统计】。单击【确定】。第2步:在【输入区域】输入原始数据所在的区域;在【输出选项】中选择结果的输出位置;选择【汇总统计】(其他选项可根据需要选择)。单击【确定】即可得到结果 Excel【数据分析】工具的应用互联网公司互联网公司统计量统计量机械制造公机械制造公司司统计量统计量平均平均0.789平均平均0.364标准误差标准误差0.078109标准误差标准误差0.074821中位数中位数0.88中位数中位数0.355众数众数0.96众数众数#N/A标准差标准差0.247002标准差标准差0.236606方差方差0.06101方差方差0.055982峰度峰度-0.20382峰度峰度-1.06272偏度偏度-0.87636偏度偏度-0.11929极差极差0.77极差极差0.66最小值最小值0.32最小值最小值0.02最大值最大值1.09最大值最大值0.68求和求和7.89求和求和3.64观测数观测数10观测数观测数104 - 252022-7-22数据分析基础Excel实现(贾俊平)思维导图思维导图数值数值特征特征水平水平差异差异形状形状4 - 262022-7-22数据分析基础Excel实现(贾俊平) THANKS THE END2022-7-22 THE END THANKS4 - 272022-7-22数据分析基础Excel实现(贾俊平)本课件制作整理者:郭迎春 仅可用于教学、学习、交流使用 如内容、图片、字体等有侵权,请联系删除。