统计学超好教程2.pdf
《统计学超好教程2.pdf》由会员分享,可在线阅读,更多相关《统计学超好教程2.pdf(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学实习卫生统计学实习何平平北京大学公共卫生学院流行病与卫生统计学系何平平北京大学公共卫生学院流行病与卫生统计学系Tel:82801619统计描述统计描述第第164180页页实习二实习二医学统计资料类型医学统计资料类型?数值变量资料数值变量资料:又称为计量资料。变量值是定量的,有单位的,表示为数值的大小。:又称为计量资料。变量值是定量的,有单位的,表示为数值的大小。?无序分类资料无序分类资料:又称为计数资料。变量值是定性的,没有单位,表示为相互独立的类别。:又称为计数资料。变量值是定性的,没有单位,表示为相互独立的类别。?有序分类资料有序分类资料:又称为等级资料。变量值是定性的,没有单位
2、,各类别具有程度上的差异。:又称为等级资料。变量值是定性的,没有单位,各类别具有程度上的差异。注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。实习二 统计描述实习二 统计描述一、数值变量资料的统计描述一、数值变量资料的统计描述统计描述包括两个方面:统计描述包括两个方面:集中趋势的描述和离散趋势的描述集中趋势的描述和离散趋势的描述(一)数值变量资料的频数表(一)数值变量资料的频数表频数表(频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或
3、者人数),以描述数值变量资料的分布特征和分布类型。:当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。一、数值变量资料的统计描述一、数值变量资料的统计描述频数表的用途1.描述频数表的用途1.描述数值变量数值变量资料的分布特征集中趋势(资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。:频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。离散趋势(离散趋势(tendency of dispersion):从中
4、心到两侧,频数分布是逐渐减少的。反映了数据的离散程度或者变异程度。:从中心到两侧,频数分布是逐渐减少的。反映了数据的离散程度或者变异程度。(一)数值变量资料的频数表一、数值变量资料的统计描述(一)数值变量资料的频数表一、数值变量资料的统计描述频数表的用途2.描述数值变量资料的分布类型正态分布频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。常见近似正态分布。:集中位置居中,左右两侧频数基本对称。常见近似正态分布。偏态分布偏态分布:集中位置偏向一侧,频数分布不对称。正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。负偏态分布:集中位置偏向数值大的
5、一侧或者右侧,有较长的左尾部。:集中位置偏向一侧,频数分布不对称。正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。(一)数值变量资料的频数表一、数值变量资料的统计描述(一)数值变量资料的频数表一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述直方图及近似正态分布直方图及近似正态分布直方图及正偏态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(二)数值变量资料的频数分布图及
6、正态曲线一、数值变量资料的统计描述60.050.040.030.020.010.00.0120100806040200直方图及负偏态分布直方图及负偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述(三)集中趋势指标描述1.算数均数(均数1.算数均数(均数mean)适用于正态分布或者近似正态分布总体均数:适用于正态分布或者近似正态分布总体均数:;样本均数:;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述2.几何均数(2.几何均数(geometric mean,G)适用于
7、一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。此资料的原始数据为正偏态分布,取对数后,对数值为正态分布,所以又称为对数正态分布。适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。此资料的原始数据为正偏态分布,取对数后,对数值为正态分布,所以又称为对数正态分布。一、数值变量资料的统计描述(三)集中趋势指标描述一、数值变量资料的统计描述(三)集中趋势指标描述3.中位数(3.中位数(median,M)适用于偏态分布资料,或者分布类型未知,或者有不确定数据时。中位数是指将一组变量值从小到大排列,位次居中的变量值。适用于偏态分布资料,或者分布类型未知,或者有不确定数据时。中位数是指将一组变
8、量值从小到大排列,位次居中的变量值。一、数值变量资料的统计描述(三)集中趋势指标描述一、数值变量资料的统计描述(三)集中趋势指标描述4.注意事项4.注意事项1.对于偏态分布资料,中位数不受两端特大值和特小值的影响,1.对于偏态分布资料,中位数不受两端特大值和特小值的影响,只和位置居中的观察值有关只和位置居中的观察值有关。而均数受特大值和特小值的影响,会偏大或者偏小,所以对于偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势。2.。而均数受特大值和特小值的影响,会偏大或者偏小,所以对于偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势。2.中位数适合于任何分布类型的资料中位数
9、适合于任何分布类型的资料,对于正态分布,理论上中位数等于均数。,对于正态分布,理论上中位数等于均数。一、数值变量资料的统计描述(三)集中趋势指标描述一、数值变量资料的统计描述(三)集中趋势指标描述(四)离散趋势指标描述一、数值变量资料的统计描述(四)离散趋势指标描述一、数值变量资料的统计描述1.极差或者全距(1.极差或者全距(range,R):表示一组变量值中最大值和最小值之差。适合任何分布类型的资料。R最大值最小值计算简单,但是不能反映所有变量值的变异程度,易受最大值和最小值的影响,不稳定:表示一组变量值中最大值和最小值之差。适合任何分布类型的资料。R最大值最小值计算简单,但是不能反映所有变
10、量值的变异程度,易受最大值和最小值的影响,不稳定2.方差(2.方差(variance):表示一组变量值的平均离散程度。方差越大,离散或者变异程度越大。适合描述近似正态分布资料的离散趋势。:表示一组变量值的平均离散程度。方差越大,离散或者变异程度越大。适合描述近似正态分布资料的离散趋势。(四)离散趋势指标描述一、数值变量资料的统计描述(四)离散趋势指标描述一、数值变量资料的统计描述本页已使用福昕阅读器进行编辑。福昕软件(C)2 0 0 5-2 0 0 9,版权所有,仅供试用。3.标准差(3.标准差(standard deviation):是方差的开方,和均数的单位一致,也表示一组变量值的平均离散
11、程度。适合描述近似正态分布资料的离散趋势。:是方差的开方,和均数的单位一致,也表示一组变量值的平均离散程度。适合描述近似正态分布资料的离散趋势。(四)离散趋势指标描述一、数值变量资料的统计描述(四)离散趋势指标描述一、数值变量资料的统计描述(四)离散趋势指标描述一、数值变量资料的统计描述(四)离散趋势指标描述一、数值变量资料的统计描述4.四分位数间距(4.四分位数间距(quartile,Q):P75、P25分别表示第75百分位数和第25百分位数。分别表示第75百分位数和第25百分位数。Q P75P25注:注:适合描述任何分布类型资料的离散趋势,主要用于偏态分布资料。适合描述任何分布类型资料的离
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 教程
限制150内