[优选文档]-医学统计学第二章PPT.ppt
《[优选文档]-医学统计学第二章PPT.ppt》由会员分享,可在线阅读,更多相关《[优选文档]-医学统计学第二章PPT.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学第二章原始资料杂乱无章【例例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。分类资料的整理列出类别,计算频数,列表2.1 频数表频数表资料整理的必要性 条理化,系统化,显示数量特征、分布规律,便于进一步统计分析数值变量资料的整理2.1.1.频数表的编制【例例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。频数表的编制方法如下频数表的编制方法如下:(1)找出观察值中的最大值和最小值,并求出极差极差(2)决定组段数、组段和组距 确定组段数要以充分反映数据的分布特征为原则 组距26.6/102.66可以参考斯特奇斯(Sturges)提出的
2、经验公式来确定分组数(3)列表划记:计算各组段包含的观察单位个数2.1.2 频数分布的图示 图图2.1 2011年某地年某地120名名7岁男童身高的频数分布岁男童身高的频数分布 1 比(相对比)常用的相对离散度指标有:极差与中位数之比;若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号同一组变量值不能同时存在正、负值。均数是算术均数的简称,习惯上用希腊字母 表示总体均数;频数分布可分为对称分布和偏态分布两种类型.尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);常以百分率()、千分率()、万分率(1/万)、十万分率(1/10万)等表示。1 比(相对比)组距26.说明一种事物内部各组成
3、部分所占的比重或分布,常以百分数表示,计算公式为:尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)百分位数(percentile)是一种位置指标,以 表示,一个百分位数 将总体或样本的全部观察值分为两个部分,理论上有X的观察值比 小,有(100-X)观察值比 大例如:新生婴儿(全人口)性别比,医护比,病床数与医护人员之比,医院的门诊人数与病床数之比,发展速度和增长速度等等。观察对象同质,时间相近,研究方法相同,以及地区、民族等客观条件一致图2.即一组数据中最大值与最小值之差。2.1.3.频数分布的分析对频数表的分析,主要在于以下几个方面:(1)有无可疑值 通过对频数分布的分析,发现某些特大或特
4、小的离 群值、可疑值(2)分布的类型 频数分布可分为对称分布和偏态分布两种类型.不同类型的分布,应采用不同的统计分析方法 对称分布,是指观察值向中央部分集中,以中等数据居多,左右两侧分布大体对称。如:正常人身高、体重,脉搏,血红蛋白等的分布对称分布对称分布对称分布对称分布对称分布对称分布 所谓偏态分布,是指观察值偏离中央所谓偏态分布,是指观察值偏离中央 尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);如:食物中毒引起腹泻的潜伏期尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)如:慢性病患者年龄的分布 左偏态左偏态左偏态左偏态左偏态左偏态 右偏态右偏态右偏态右偏态右偏态右偏态例如:新生婴儿(全
5、人口)性别比,医护比,病床数与医护人员之比,医院的门诊人数与病床数之比,发展速度和增长速度等等。观察对象同质,时间相近,研究方法相同,以及地区、民族等客观条件一致如:正常人身高、体重,脉搏,血红蛋白等的分布4】5人的血清抗体滴度分别为1:10,1:20,1:40,1:40,1:160,求平均滴度。1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,计算公式为:9】三组同性别、同年龄儿童的体重(kg)如下,试分析其集中趋势和离散程度。尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)实际应用中,如果观察例数小于20时,都
6、不宜计算相对数。百分位数(percentile)是一种位置指标,以 表示,一个百分位数 将总体或样本的全部观察值分为两个部分,理论上有X的观察值比 小,有(100-X)观察值比 大1)未分组资料(原始资料)的均数的计算方法:4】5人的血清抗体滴度分别为1:10,1:20,1:40,1:40,1:160,求平均滴度。平均数反映一组观察值的集中趋势、中心位置或平均水平有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),算术均数对这类资料集中趋势的代表性就差,这时宜用几何均数反映其平均增(减)倍数。除研究因素外,其他的重要影响因素应相同或相近(2)决定组
7、段数、组段和组距设计的周密程度,实验条件的严格控制不同时对研究对象的例数要求不同实际应用中,如果观察例数小于20时,都不宜计算相对数。(3)分布特征分布特征 分布的两个重要特征:集中趋势和离散趋势 总体中的个体总是具有同质性,这些同质性使得观察值应趋向同一数值(即集中趋势)。同一总体中的个体之间又普遍存在着各种差别,使得个体观察值不会完全相同。2.2 集中趋势的描述集中趋势的描述平均数反映一组观察值的集中趋势、中心位置或平均水平它是该组数据的代表,能对一群同类事物或现象的数量特征作出概括的说明,是统计学中应用最广泛、最重要的一个指标体系。常用的平均数有(算术)均数,几何均数和中位数 2.2.1
8、 均数均数 均数是算术均数的简称,习惯上用希腊字母 表示总体均数;用 表示样本均数。均数反映一组观察值在数量上的平均水平,最适合单峰对称分布资料的平均水平的描述。1)未分组资料(原始资料)的均数的计算方法:将所有的观察值直接相加,再除以总观察数n【例例 2.3】求表2.1中资料的均数2.2.2 几何均数几何均数 有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),算术均数对这类资料集中趋势的代表性就差,这时宜用几何均数反映其平均增(减)倍数。几何均数一般用G表示,适用于各变量值之间成倍数关系,但作对数变换后指标成单峰对称分布的资料。【例例2.4】5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优选文档 优选 文档 医学 统计学 第二 PPT
限制150内