第2章 统计描述.pdf





《第2章 统计描述.pdf》由会员分享,可在线阅读,更多相关《第2章 统计描述.pdf(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章第二章第二章 统计描述统计描述统计描述统计描述2.1 2.1 定量资料的统计描述定量资料的统计描述2.2 定性资料的统计描述2.3 常用统计图表2.2 定性资料的统计描述2.3 常用统计图表计算机演示SPSS操作方法见教材附录A SPSS统计软件入门计算机演示SPSS操作方法见教材附录A SPSS统计软件入门2.1 定量资料的统计描述定量资料的统计描述一、一、一、一、频数分布表频数分布表频数分布表频数分布表二、频数分布图二、频数分布图三、定量数据描述指标三、定量数据描述指标频数分布表的意义频数分布表的意义频数分布表的意义频数分布表的意义频数频数频数频数(frequency freq
2、uency):指在一个抽样资料中,指在一个抽样资料中,指在一个抽样资料中,指在一个抽样资料中,某变量值出现的次数,将各变量及其频数某变量值出现的次数,将各变量及其频数某变量值出现的次数,将各变量及其频数某变量值出现的次数,将各变量及其频数列于表内,称为列于表内,称为列于表内,称为列于表内,称为频数表频数表频数表频数表。目的:通过频数表来描述资料的分布规律目的:通过频数表来描述资料的分布规律目的:通过频数表来描述资料的分布规律目的:通过频数表来描述资料的分布规律参见教材参见教材参见教材参见教材P15P15:例题:例题:例题:例题2 2-1 1例1 某农村地区1999年14岁女孩的身高资料如下,请
3、编频数表和观察频数分布情况。例1 某农村地区1999年14岁女孩的身高资料如下,请编频数表和观察频数分布情况。表表表表9 9-1 1频数表的编制方法:频数表的编制方法:频数表的编制方法:频数表的编制方法:计算全距 计算全距 定组距 定组距 写组段 写组段 划记 划记表表表表9 9-2 2图图图图9 9-1 1通过频数表的观察,可以看出变量值的分布有通过频数表的观察,可以看出变量值的分布有2个重要特征个重要特征集中趋势集中趋势(central tendency):指变量值的集中位置,数据较集中。指变量值的集中位置,数据较集中。离中趋势离中趋势(tendency of dispersion):指变
4、量值围绕集中位置的分布情况。:指变量值围绕集中位置的分布情况。频数分布类型:频数分布类型:频数分布类型:频数分布类型:频 数分 布频 数分 布偏态分布偏态分布正偏正偏负偏负偏正态分布正态分布三、定量数据描述指标三、定量数据描述指标描述变量值分布的集中趋势用平均指标,描述变量值分布的集中趋势用平均指标,描述变量值分布的集中趋势用平均指标,描述变量值分布的集中趋势用平均指标,常称平均数。平均数反映一群变量值的平均常称平均数。平均数反映一群变量值的平均常称平均数。平均数反映一群变量值的平均常称平均数。平均数反映一群变量值的平均水平或集中位置,是统计中最重要和应用水平或集中位置,是统计中最重要和应用水
5、平或集中位置,是统计中最重要和应用水平或集中位置,是统计中最重要和应用最广泛的统计指标。最广泛的统计指标。最广泛的统计指标。最广泛的统计指标。1.对称分布对称分布资料的描述资料的描述算术算术算术平均数算术平均数标准差与方差标准差与方差标准差与方差标准差与方差S S S S、S S S S2 2 2 2X 算术平均数(算术平均数(arithmetic)简称:均数(简称:均数(mean)使用条件:使用条件:数据分布比较均匀呈数据分布比较均匀呈正态分布或近似正态分布正态分布或近似正态分布样本均数用符号:样本均数用符号:X 表示表示总体均数用符号:表示总体均数用符号:表示 标准差和方差 标准差和方差标
6、准差标准差标准差标准差(standard deviation)SD(standard deviation)SD 或或或或S S方差方差方差方差(variance)(variance)S S2 2使用条件:反映正态分布或近似正态分布观察值的离散趋势及变异度。使用条件:反映正态分布或近似正态分布观察值的离散趋势及变异度。n n-1 1 就是众所周知以后非常熟悉而经常用到的就是众所周知以后非常熟悉而经常用到的就是众所周知以后非常熟悉而经常用到的就是众所周知以后非常熟悉而经常用到的自由度(自由度(自由度(自由度(degree of freedom degree of freedom)。)。)。)。用希
7、腊字母表示:用希腊字母表示:用希腊字母表示:用希腊字母表示:njunju:mjumju:区别区别区别区别?得到如下的公式得到如下的公式得到如下的公式得到如下的公式:1)(1)(222=nXXSnXXS(2-4)2.非对称分布资料的统计描述非对称分布资料的统计描述中位数和百分位数中位数和百分位数中位数和百分位数中位数和百分位数四分位数间距四分位数间距四分位数间距四分位数间距其它指标其它指标其它指标其它指标中位数和百分位数中位数和百分位数中位数和百分位数中位数和百分位数Median and PercentileMedian and Percentile中位数简记:中位数简记:M,指一组观察值从大到
8、,指一组观察值从大到小排序,位于中间的数就是中位数。小排序,位于中间的数就是中位数。百分位数简记百分位数简记:Px,当当 P50=M?条件:条件:当一组资料类型分布不清或明显偏态分布,分布的一端或两端无界时。当一组资料类型分布不清或明显偏态分布,分布的一端或两端无界时。公式:略。见教材公式:略。见教材P18解释解释:P50=M小大小大0 25 50 75 100P0 P25 P50 P75P100M百分位数用Px表示百分位数用Px表示中位数和百分位数应用中位数和百分位数应用中位数用于任何分布,特别是偏态分布,一端和两端无确切数据。中位数用于任何分布,特别是偏态分布,一端和两端无确切数据。百分位
9、数用于非正态资料的医学参考值估计,要求样本量足够大。百分位数用于非正态资料的医学参考值估计,要求样本量足够大。例例2-5现有现有275例某种沙门菌食物中毒患者的潜伏期例某种沙门菌食物中毒患者的潜伏期(h),其频数分布见表其频数分布见表2-2,分别求出分别求出P5和和P95百分位数和中位数百分位数和中位数。四分位数间距(四分位数间距(四分位数间距(四分位数间距(quartile quartile 用用用用QQ表示)表示)表示)表示)小大小大1 25 50 75 100P1 P25 P50 P75 P100Q Q Q QU U U UQ Q Q QL L L L下四分位数下四分位数下四分位数下四分
10、位数上四分位数上四分位数上四分位数上四分位数Q Q Q QU U U U Q Q Q QL L L L=四分位数间距四分位数间距四分位数间距四分位数间距四分位数间距的意义四分位数间距的意义四分位数间距的意义四分位数间距的意义:四分位数间距越大,变量值的变异四分位数间距越大,变量值的变异四分位数间距越大,变量值的变异四分位数间距越大,变量值的变异程度或离散程度越大。程度或离散程度越大。程度或离散程度越大。程度或离散程度越大。因为越靠近两端因为越靠近两端因为越靠近两端因为越靠近两端的百分位数越不稳定的百分位数越不稳定的百分位数越不稳定的百分位数越不稳定。常用于描述偏态。常用于描述偏态。常用于描述偏
11、态。常用于描述偏态分布资料的离散程度指标。但未考虑每分布资料的离散程度指标。但未考虑每分布资料的离散程度指标。但未考虑每分布资料的离散程度指标。但未考虑每个观察值的变异。个观察值的变异。个观察值的变异。个观察值的变异。其它常用统计描述指标其它常用统计描述指标几何均数几何均数全距全距变异系数变异系数几何均数(几何均数(几何均数(几何均数(geometric meangeometric mean)条件:条件:条件:条件:用于原始数据分布呈偏态分布;少数数据偏大,数据呈倍数关系或等比数列。用于原始数据分布呈偏态分布;少数数据偏大,数据呈倍数关系或等比数列。如:抗体的滴度、细菌的计数、传染病潜伏期或频
12、数明显呈偏态,各观察值之间呈倍数变化。如:抗体的滴度、细菌的计数、传染病潜伏期或频数明显呈偏态,各观察值之间呈倍数变化。计算方法:略。计算方法:略。众数调和均数,略。众数调和均数,略。全距(全距(全距(全距(rangerange):):):):意义:表示一组变量值的最大与最小值 之差,反映样本变量值的全范围。条件:意义:表示一组变量值的最大与最小值 之差,反映样本变量值的全范围。条件:全距对变量值的各种分布类型的资料都适用。全距对变量值的各种分布类型的资料都适用。优点:简单明了,容易理解,使用方便。缺点:仅考虑了极大值和极小值,未考虑其它变量的个体差异。建议:与其他离散指标共同使用。优点:简单
13、明了,容易理解,使用方便。缺点:仅考虑了极大值和极小值,未考虑其它变量的个体差异。建议:与其他离散指标共同使用。变异系数变异系数(coefficient of variation)意义:意义:极差、标准差和四分位数间距都有单位极差、标准差和四分位数间距都有单位的,而变异系数是相对数,没有单位,用标准的,而变异系数是相对数,没有单位,用标准差与均数之比,用百分数表示。差与均数之比,用百分数表示。公式:公式:%100=XSCV(2(2(2(2-13)13)13)13)条件:条件:比较单位不同的多组资料的变异度比较单位不同的多组资料的变异度比较均数相差悬殊的多组资料变异比较均数相差悬殊的多组资料变异
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2章 统计描述 统计 描述

限制150内