(03)第3章用统计量描述性数据(T8)ppt课件(完整版).pptx
-
资源ID:16924627
资源大小:2.64MB
全文页数:23页
- 资源格式: PPTX
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(03)第3章用统计量描述性数据(T8)ppt课件(完整版).pptx
(03)第3章 用统计量描述性数据(T8)ppt课件(完整版)3 - 2统计学(第 8 版)贾俊平2022-5-192022-5-19统 计 学 ( (第第8 8版版) )3 - 3统计学(第 8 版)贾俊平2022-5-192022-5-193 - 4统计学(第 8 版)贾俊平2022-5-192022-5-19哪名运动员发挥更稳定 思考以下问题思考以下问题 在2008年的第29届北京奥运会女子10米气手枪比赛中,每个运动员首先进行每组10枪共4组的预赛,根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,预赛成绩加上决赛成绩确定最后的名次。在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表所示 最后的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅帕杰林娜以总成绩489.1环获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺萨卢克瓦泽以总成绩487.4环获得铜牌,而预赛排在第3名的蒙古国运动员卓格巴德拉赫蒙赫珠勒仅以479.6环的成绩名列第8。 由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?通过本章内容的学习就能很容易回答这样的问题纳塔利纳塔利娅娅帕杰林娜帕杰林娜郭文珺郭文珺卓格巴德拉卓格巴德拉赫赫蒙赫珠勒蒙赫珠勒妮诺妮诺萨卢克瓦萨卢克瓦泽泽维多利维多利亚亚柴卡柴卡莱万多夫斯莱万多夫斯卡卡萨贡萨贡亚斯娜亚斯娜舍卡里奇舍卡里奇10.010.010.010.09.39.39.89.89.39.38.18.110.210.28.58.510.510.510.010.010.310.39.49.410.310.39.69.610.010.010.410.48.78.710.010.010.410.49.29.29.99.910.210.210.410.48.38.39.59.510.110.19.99.99.99.910.610.610.110.19.29.210.210.210.210.29.89.89.39.310.510.510.310.39.59.510.710.710.510.510.410.49.19.19.89.89.49.48.58.510.410.49.29.29.99.99.79.79.79.710.710.710.710.710.610.610.510.59.49.410.010.09.59.510.810.89.29.29.19.19.89.810.710.79.39.39.39.39.79.79.29.210.810.88.68.69.69.69.99.93 - 5统计学(第 8 版)贾俊平2022-5-192022-5-19描述描述量量统统计计思维导图思维导图用统计量描述数据用统计量描述数据描述水平平均数分位数中位数四分位数百分位数众数描述差异极差和四分位差方差和标准差离散系数标准分数描述分布形状偏度系数峰度系数3 - 6统计学(第 8 版)贾俊平2022-5-192022-5-19 描述水平的统计量 平均数平均数3 - 7统计学(第 8 版)贾俊平2022-5-192022-5-19 平均数平均数简单平均数简单平均数例题分析例题分析【例例3-1】在某年级中随机抽取30名学生,得到每名学生的统计学考试分数如表3-1 所示。计算30名学生考试分数的平均数 描述水平的统计量8585979783836161676786865555929270708686818175759191555596968686898991916666878772729292505082827979909090908585959566663 - 8统计学(第 8 版)贾俊平2022-5-192022-5-19 平均数平均数加权平均数加权平均数例题分析例题分析【例例3-1】沿用例3-1。假定将30名学生的数学考试分数分组后结果表3-2所示。计算考试分数的平均数 描述水平的统计量分组分组组中值(组中值(m m)人数(人数(f f) 60 60以下以下55553 36070607065654 47080708075754 48090809085851010 90100 9010095959 9合计合计3030分组分组 60 60以下以下55553 31651656070607065654 42602607080708075754 43003008090809085851010850850 90100 9010095959 9855855合计合计3030243024303 - 9统计学(第 8 版)贾俊平2022-5-192022-5-19 分位数分位数中位数中位数例题分析例题分析l分位数分位数一组数据按从小到大排序后,可以找出排在某个位置上的数值,该数值可以代表数据水平的高低。这些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等l中位数中位数排序后处于中间位置上的值。不受极端值影响 描述水平的统计量3 - 10统计学(第 8 版)贾俊平2022-5-192022-5-19 分位数分位数四分位数四分位数例题分析例题分析l四分位数四分位数一组数据排序后处在25%和75%位置上的数值l它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。l中间的四分位数就是中位数,通常所说的四分位数是指处在25%位置上和75%位置上的两个数值 描述水平的统计量3 - 11统计学(第 8 版)贾俊平2022-5-192022-5-19 分位数分位数百分位数百分位数例题分析例题分析l百分位数百分位数用99个点将数据分成100等份,处在各分位点上的数值就是百分位数l百分位数提供了各项数据在最小值和最大值之间分布的信息 描述水平的统计量3 - 12统计学(第 8 版)贾俊平2022-5-192022-5-19 众数众数各统计量的比较各统计量的比较l众数众数一组数据中出现次数最多的变量值l一组数据可能没有众数或有几个众数l适合于数据量较多时使用l实际中很少使用l平均数易受极端值影响数学性质优良,实际中最常用数据对称分布或接近对称分布时代表性较好l中位数不受极端值影响数据分布偏斜程度较大时代表性接好l众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时代表性较好 描述水平的统计量3 - 13统计学(第 8 版)贾俊平2022-5-192022-5-19 极差和四分位差极差和四分位差 描述差异的统计量3 - 14统计学(第 8 版)贾俊平2022-5-192022-5-19 方差和标准差方差和标准差l 方差方差各变量值与均值的平均差异l 标准差标准差上四分位数与下四分位数之差 描述差异的统计量3 - 15统计学(第 8 版)贾俊平2022-5-192022-5-19 方差和标准差方差和标准差例题分析例题分析【例【例3-8】沿用例3-2。根据表3-2的分组 数 据 , 计算 考 试 分 数的标准差 描述差异的统计量分组分组 60 60以下以下55553 3625625187518756070607065654 42252259009007080708075754 4252510010080908090858510102525250250 90100 9010095959 922522520252025合计合计3030515051503 - 16统计学(第 8 版)贾俊平2022-5-192022-5-19 离散系数离散系数例题分析例题分析l离散系数离散系数标准差与其相应的均值之比l对数据相对离散程度的测度l消除了数据水平高低和计量单位的影响l用于对不同组别数据离散程度的比较l计算公式为【 例例3-5】评价哪名运动员的发挥更稳定 描述差异的统计量纳塔利纳塔利娅娅帕杰林娜帕杰林娜郭文珺郭文珺卓格巴德拉卓格巴德拉赫赫蒙赫珠勒蒙赫珠勒妮诺妮诺萨卢克瓦萨卢克瓦泽泽维多利维多利亚亚柴卡柴卡莱万多夫斯莱万多夫斯卡卡萨贡萨贡亚斯娜亚斯娜舍卡里奇舍卡里奇10.010.010.010.09.39.39.89.89.39.38.18.110.210.28.58.510.510.510.010.010.310.39.49.410.310.39.69.610.010.010.410.48.78.710.010.010.410.49.29.29.99.910.210.210.410.48.38.39.59.510.110.19.99.99.99.910.610.610.110.19.29.210.210.210.210.29.89.89.39.310.510.510.310.39.59.510.710.710.510.510.410.49.19.19.89.89.49.48.58.510.410.49.29.29.99.99.79.79.79.710.710.710.710.710.610.610.510.59.49.410.010.09.59.510.810.89.29.29.19.19.89.810.710.79.39.39.39.39.79.79.29.210.810.88.68.69.69.69.99.93 - 17统计学(第 8 版)贾俊平2022-5-192022-5-19 离散系数离散系数例题分析例题分析【 例例3-5】评价哪名运动员的发挥更稳定 描述差异的统计量运动员运动员国家国家平均环数平均环数标准差标准差离散系数离散系数纳塔利娅纳塔利娅帕杰林娜帕杰林娜俄罗斯俄罗斯9.819.810.61540.61540.06270.0627郭文珺郭文珺中国中国10.2310.230.43730.43730.04270.0427卓格巴德拉赫卓格巴德拉赫蒙赫珠勒蒙赫珠勒蒙古国蒙古国9.269.260.70740.70740.07640.0764妮诺妮诺萨卢克瓦泽萨卢克瓦泽格鲁吉亚格鲁吉亚10.1410.140.54610.54610.05390.0539维多利亚维多利亚柴卡柴卡白俄罗斯白俄罗斯9.809.800.64980.64980.06630.0663莱万多夫斯卡莱万多夫斯卡萨贡萨贡波兰波兰9.739.730.73340.73340.07540.0754亚斯娜亚斯娜舍卡里奇舍卡里奇塞尔维亚塞尔维亚9.699.690.35730.35730.03690.0369米拉米拉内万苏内万苏芬兰芬兰9.659.650.46250.46250.04790.04793 - 18统计学(第 8 版)贾俊平2022-5-192022-5-19 标准分数标准分数例题分析例题分析l标准分数也称标准化值l对某一个值在一组数据中相对位置的度量l可用于判断一组数据是否有离群点(outlier)l用于对变量的标准化处理l计算公式为【 例例3-10】例3-9的标准分数SPSS输出 描述差异的统计量3 - 19统计学(第 8 版)贾俊平2022-5-192022-5-19 标准分数标准分数经验法则与切比雪夫不等式经验法则与切比雪夫不等式判断数据的离群点判断数据的离群点经验法则经验法则当一组数据对称分布时l约有68%的数据在平均数加减1个标准差的范围之内l约有95%的数据在平均数加减2个标准差的范围之内l约有99%的数据在平均数加减3个标准差的范围之内 l切比雪夫不等式切比雪夫不等式如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用l切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”l对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数l对于k=2,3,4,该不等式的含义是至少有75%的数据落在平均数加减2个标准差的范围之内至少有89%的数据落在平均数加减3个标准差的范围之内至少有94%的数据落在平均数加减4个标准差的范围之内 描述差异的统计量3 - 20统计学(第 8 版)贾俊平2022-5-192022-5-19 偏度系数偏度系数 描述分布形状的统计量3 - 21统计学(第 8 版)贾俊平2022-5-192022-5-19 峰度系数峰度系数l峰度峰度(kurtosis)指数据分布峰值的高低l由统计学家K.Pearson于1905年首次提出l峰度系数峰度系数测度一组数据分布 峰 值 高 低 的 统 计 量 是(coefficient of kurtosis),记作K 描述分布形状的统计量3 - 22统计学(第 8 版)贾俊平2022-5-192022-5-19 SPSSSPSS和和ExcelExcel综合输出综合输出l使 用 S P S S 的【 分 析 】 【描述统计】 【 频 率 】(或【描述】)l使用Excel【数据】【数据分析】【描述统计】 描述数据的统计量列列1平均平均80标准误差标准误差2.412611中位数中位数85众数众数86标准差标准差13.21441方差方差174.6207峰度峰度-0.35146偏度偏度-0.83136区域区域47最小值最小值50最大值最大值97求和求和2400观测数观测数30SPSS输出的输出的30名学生考试分数描述统计量名学生考试分数描述统计量Excel输出的输出的30名学生考试分数描述统计量名学生考试分数描述统计量3 - 23统计学(第 8 版)贾俊平2022-5-192022-5-19 THANKS THE END2022-5-19 THE END THANKS概括数据特征度量