数据指标3章统计数据的描述度量ppt课件.ppt
病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程本章教学目标:本章教学目标:度量中心(集中)趋势的指标度量离散程度(变异性)的指标度量偏斜程度的指标度量两种数值变量关系的指标掌握利用 Office 软件计算各种统计指标第第3 3章章 统计数据的描述度量统计数据的描述度量2023/1/211病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)2023/1/212病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程数据分布的特征和测度数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状分布的形状分布的形状集中趋势集中趋势集中趋势集中趋势离散程度离散程度离散程度离散程度众众众众 数数数数中位数中位数中位数中位数均均均均 值值值值离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰 度度度度四分位差四分位差四分位差四分位差变异系数变异系数变异系数变异系数偏偏偏偏 态态态态四分位数四分位数2023/1/213病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程3.1 3.1 度量集中趋势的平均指标度量集中趋势的平均指标平均指标是说明社会经济现象一般水平平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势的统计指标,反映标志值分布的集中趋势平均指标按计算方式可分为数值平均数和平均指标按计算方式可分为数值平均数和位置平均数两大类位置平均数两大类2023/1/214病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。(一一)算术平均数(算术平均数(Arithmetic Mean)算术平均数的基本公式算术平均数的基本公式一一.数值平均数数值平均数2023/1/215病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 (1)(1)简单算术平均数简单算术平均数算术平均数的计算算术平均数的计算 n 总体单位总数;xi 第i个单位的标志值。xi 第i 组的代表值(组中值或该组变量值);f i 第i 组的频数。(2)(2)加权算术平均数加权算术平均数2023/1/216病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程单项数列单项数列 分组数列分组数列 2023/1/217病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程使用使用ExcelExcel函数求加权算术平均数函数求加权算术平均数利用Excel“数学和三角函数”中的SUMPRODUCT 函数可以方便地计算出分组数据的加权算术平均数。语法规则:语法规则:格式:SUMPRODUCT(,)功能:返回两个或多个区域中对应元素乘积之和。例例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。2023/1/218病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2023/1/219病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(二二)几何平均数几何平均数(Geometric Mean)当统计资料是各时期的发展速度等前后期的两两环比数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是n 个数连乘积的n 次方根。1.简单几何平均数简单几何平均数 2.加权几何平均数加权几何平均数f i各比率出现的频数 2023/1/2110病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程例例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一解一:解二解二:年平均增长率=1.0688-1=6.88%2023/1/2111病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程50%decrease 100%increase算术平均数算术平均数:几何平均数几何平均数:2023/1/2112病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程使用使用ExcelExcel求几何平均数求几何平均数可以使用Excel统计函数中的GEOMEAN 函数返回几何平均数语法规则:格式:GEOMEAN(,)功能:返回所有参数中数据的几何平均数。2023/1/2113病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一一)中位数中位数(Median)将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。比如有 5 笔付款:9元,10元,10元,11元,60元付款的均值为 20 元,显然这并不是一个很好的代表值,而中位数 Me=10 元则更能代表平均每笔的付款数。二二.位置平均数位置平均数2023/1/2114病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程使用使用ExcelExcel的统计函数返回未分组数据的中位数的统计函数返回未分组数据的中位数可以使用Excel统计函数中的MEDIAN函数返回未分组数据的中位数。格式:格式:MEDIAN(,2,)功能:功能:返回所有参数中数据的中位数。返回所有参数中数据的中位数。0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 Median=5Median=52023/1/2115病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程分组数据中位数的确定分组数据中位数的确定 对于分组数据的统计资料,中位数要用插值法来估算。(1)计算各组的累计频数;(2)确定中位数所在的组 是累计频数首次包含中位数f/2的组。其中:L 中位数所在组的下限;Sm-1 中位数所在组前一组的累计频数;fm 中位数所在组的频数;d 中位数所在组的组距。2023/1/2116病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程例例:计算下表数据的中位数解解:f/2=27.5,中位数在“15-25”的组中,2023/1/2117病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(二二)众数众数(Mode)是总体中出现次数最多的标志值,记为M 0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。2023/1/2118病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程众数众数(众数的不唯一性众数的不唯一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 422023/1/2119病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程未分组数据众数的确定未分组数据众数的确定在数据量很大的时候,可以使用Excel统计函数中的MODE函数返回众数。格式:MODE(,)功能:返回所有参数中数据的众数。0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode=92023/1/2120病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程分组数据众数的确定分组数据众数的确定对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组 对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算其中:L 众数组的下限1 众数组与前一组的频数之差2 众数组与后一组的频数之差 d 众数组的组距12众数Ld2023/1/2121病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程例例:计算下表数据的众数解:解:众数组是“15-25”的组,则2023/1/2122病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程三三.算术平均数和位置平均数间的关系算术平均数和位置平均数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同0 xf(Me,M0)0 xfMeM00 xfMeM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数2023/1/2123病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程补充习题补充习题补充题:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众平均数、中位数和众数数。2023/1/2124病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 答案答案f/2=143/2=71.5,中位数所在“100150”的组,众数组为“100150”的组,2023/1/2125病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程四分位数四分位数(Quartile)(Quartile)(概念要点概念要点)1.集中趋势的测度值之一集中趋势的测度值之一2.排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值3.不受极端值的影响不受极端值的影响 4.可可用用于于定定序序数数据据,也也可可用用于于数数值值型型数数据据,但不能用于定类数据但不能用于定类数据QQL LQQMMQQU U25%25%25%25%2023/1/2126病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程四分位数四分位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:下四分位数下四分位数(QQL L)位置位置 =N+N+1 14 4上四分位数上四分位数(QQU U)位置位置 =3(3(N+N+1)1)4 4下四分位数下四分位数(QQL L)位置位置 =N N4 4上四分位数上四分位数(QQL L)位置位置 =3N3N4 42023/1/2127病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程未分组数据四分位数的确定未分组数据四分位数的确定p规则规则1 1 如果结果是整数,四分位数等于那个整数位置的数据。p规则规则2 2 如果结果是半数(如2.5,3.5等),四分位数等于相邻有序数据的平均数。p规则规则3 3 如果结果既不是整数又不是半数,结果取最接近的整数,并选数据。2023/1/2128病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程数值型未分组数据的四分位数数值型未分组数据的四分位数 (7(7个数据的算例个数据的算例)原始数据原始数据:23 21 30 32 28 25 26排排 序序:21 23 25 26 28 30 32位位 置置:1 2 3 4 5 6 7 QL=237+7+1 1QQL L位置位置 =4 4=4 4=2=2QQU U位置位置 =3(3(N+N+1)1)4 43(73(7+1)1)4 4=6=6QU=302023/1/2129病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程数值型未分组数据的四分位数数值型未分组数据的四分位数 (6(6个数据的算例个数据的算例)原始数据原始数据:23 21 30 28 25 26排排 序序:21 23 25 26 28 30位位 置置:1 2 3 4 5 6QQL L=23=23QQL L位置位置 =N+N+1 14 4=6+6+1 14 4=1.75=1.75QQU U位置位置 =3(3(N+N+1)1)4 43(63(6+1)1)4 4=5.25=5.25QQU U=28=282023/1/2130病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 ExcelExcel中四分位数的计算过程中四分位数的计算过程 2023/1/2131病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程原始数据原始数据:23 21 30 28 25 26排排 序序:21 23 25 26 28 30位位 置置:1 2 3 4 5 6QQL L=23+0.25*(25-23)=23+0.25*(25-23)=23.5 =23.5QQL L位置位置 =N-N-1 14 4=QQU U位置位置 =3(3(N-N-1)1)4 4=4.754.75QQU U=26+0.75(28-26)=26+0.75(28-26)=27.5 =27.51+1+数值型未分组数据的四分位数数值型未分组数据的四分位数 (6(6个数据的算例个数据的算例)2.251+1+2023/1/2132病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程数值型分组数据的四分位数数值型分组数据的四分位数上四分位数上四分位数上四分位数上四分位数:下四分位数下四分位数下四分位数下四分位数:2023/1/2133病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程Q QL L位置位置50/450/412.512.5QU位置位置350/437.5表表 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105105 110110110110 115115115115 120120120120 125125125125 130130130130 135135135135 1401403 35 58 8141410106 64 43 38 816163030404046465050合计合计5050数值型分组数据的四分位数数值型分组数据的四分位数【例例例例】根根根根据据据据第第第第三三三三章章章章表表表表中中中中的的的的数数数数据据据据,计计计计算算算算50 50 名工人日加工零件数的四分位数名工人日加工零件数的四分位数名工人日加工零件数的四分位数名工人日加工零件数的四分位数2023/1/2134病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程五数汇总和箱线图五数汇总和箱线图Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12 30 45 57 702023/1/2135病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程右偏右偏Right-Skewed左偏左偏Left-SkewedSymmetric五数汇总和箱线图五数汇总和箱线图2023/1/2136病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程x频数要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差、变异系数和Z值。3.2 3.2 度量离散程度的指标度量离散程度的指标2023/1/2137病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程【案例案例】道格拉斯公司应如何选择供应商道格拉斯公司应如何选择供应商道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?2023/1/2138病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程一一.极差极差(Range)极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据的信息,因而是一种比较粗糙的变异指标。2023/1/2139病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2023/1/2141D4andD3arefromTable(n=5)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程UCL=8.232024681234567MinutesDayLCL=0R=3.894_Conclusion:Variationisincontrol2023/1/2143病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程二、四分位差二、四分位差1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差 Q QD D =Q QU U-Q QL L4.反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性2023/1/2144病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程二、四分位差二、四分位差Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12 30 45 57 70Interquartilerange=5730=272023/1/2145病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程三三.平均差平均差平均差是各数据与其均值离差绝对值的算术平均数,通常记为AD。平均差越大,反映数据间的差异越大。但由于使用了绝对值,其数学性质很差,因而很少使用。2023/1/2147病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程四四.方差方差(Variance)和标准差和标准差(Standard Deviation)方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。应注意总体方差、标准差与样本方差、标准差是有区别的。1.总体方差(Population Variance)和总体标准差(Population Standard Deviation)总体方差是各总体数据与其均值差平方的均值,记为 2,总体标准差记为。2023/1/2148病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2.2.样本方差与样本标准差样本方差与样本标准差样本方差记为 S 2,样本标准差记为S,在推断统计中,它们分别是总体方差和标准差的优良估计。其中:n 为样本容量,Xi 为样本观察值为样本均值。2023/1/2149病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程未分组数据方差和标准差的计算未分组数据方差和标准差的计算方差和标准差的手工计算非常烦琐,只要求掌握以下两种方法。(1)使用Excel的统计函数VARP(,)功能:返回所有参数中数据的总体方差。STDEVP(,)功能:返回所有参数中数据的总体标准差。VAR(,)功能:返回所有参数中数据的样本方差。STDEV(,)功能:返回所有参数中数据的样本标准差。2023/1/2150病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程分组数据的方差与标准差分组数据的方差与标准差如果得到的是分组的频数分布数据,则方差与标准差的公式如下:其中Xi是第i组的组中值或标志值。2023/1/2151病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程变异系数变异系数在对上海和南京两地居民生活质量调查发现,上海居民平均月收入1800元,标准差为180元;南京居民平均月收入1200元,标准差为160元。问两地居民收入差距哪个更大?2023/1/2152病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程Z Z值值通常,Z值小于-3.0或大于+3.0时,认为数据中含有极端值 2023/1/2153病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程是非标志的平均数和标准差是非标志的平均数和标准差在对社会经济现象进行分析时,经常要将总体的所有单位按是否具有某种属性划分为两组,即“是”与“非”的两组。如将学生按性别分组,将产品按合格与否分组。又如在民意调查中,将被调查者按是否支持某位侯选人或是否赞成某项政策分为两组等等。2023/1/2154病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(1)(1)比例的概念比例的概念比例是指具有某种性质或属性的单位数占总体全部单位数的比重(也称成数),记为P。N1总体中具有某一属性的单位数;N 总体单位总数。如产品中的次品率;全部人口或某单位职工中男、女的比率;某地区全部家庭中高(如月收入10000元)、中、低(月收入1000元)收入家庭各占的比重等。2023/1/2155病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(2)(2)比例的平均数比例的平均数要计算比例的平均数,需要将是非标志的标志表现进行量化处理。记1代表具有某种属性的标志表现0代表不具有该属性的标志表现N1总体中具有该属性的单位数N0总体中不具有该属性的单位数N 总体单位总数则由加权算术平均数的计算公式,比例的平均数为可知,比例的平均数就是其本身比例的平均数就是其本身。2023/1/2156病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(3)(3)比例的方差和标准差比例的方差和标准差,由分组数据方差的计算公式:当P=0.5时,成数的标准差达到最大值,即2023/1/2157病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程偏态与峰度分布的形状偏态与峰度分布的形状扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布偏态偏态偏态偏态峰度峰度峰度峰度左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与标准正态与标准正态与标准正态与标准正态分布比较!分布比较!分布比较!分布比较!3.3 3.3 度量偏斜程度的指标度量偏斜程度的指标2023/1/2158病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程偏度系数是度量偏斜程度的指标,不分组数据的偏度系数主要有以下两种计算方法:一、用标准差为单位计量的偏度系数(Skewness)该偏度系数记为SK,计算公式为SK是无量纲的量,取值通常在-3+3之间,其绝对值越大,表明偏斜程度越大。当分布呈右偏态时,SK0,故也称正偏态;当分布为左偏态时,SK0,故也称负偏态。但除非是分组频数分布数据,否则SK公式中的众数M0有很大的随机性。3.3 3.3 度量偏斜程度的指标度量偏斜程度的指标2023/1/2159病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程二、使用三阶中心矩计量的偏度系数 该偏度系数是用三阶中心矩除以标准差的三次方来度量偏斜程度,记为,计算公式为 称为三阶中心矩。偏度系数 可以适用任何数据。和SK的计算方法不同,因此根据同一资料计算的结果也不相同。2023/1/2160病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程户户户户户户数数数数数数比比比比比比重重重重重重(%)(%)(%)25252020151510105 5农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图偏度系数偏度系数(从直方图上观察从直方图上观察)按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组(元元元元元元)10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论:结论:结论:结论:为右偏分布为右偏分布 2023/1/2161病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程偏度系数的Excel计算可以使用Excel统计函数中的SKEW函数返回数据的偏度系数,语法规则如下:格式:SKEW(,)功能:返回所有参数中数据的偏度系数。2023/1/2162病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程3.4 3.4 度量两种数值变量关系的指标度量两种数值变量关系的指标协方差度量两数值变量间的线性关系。协方差指出两数值变量是否线性联系或相关。当相关系数接近+1或-1,两变量间有很强线性相关。当相关系数接近0,几乎不相关。相关系数指出数据是否正相关或负相关。强相关不说明因果。只是说明数据之间的趋势 2023/1/2163病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程使用使用 Excel 求各种统计指标求各种统计指标当数据量很大时,手工计算统计指标是非常烦琐的,尤其是标准差、方差数等的计算量很大。使用Excel【工具】“数据分析”“描述统计”功能,可以方便地计算出各种综合统计指标。http:/devdata.worldbank.org/DataVisualizer/2023/1/2164