最新医学统计学-全科1精品课件.ppt
《最新医学统计学-全科1精品课件.ppt》由会员分享,可在线阅读,更多相关《最新医学统计学-全科1精品课件.ppt(123页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学医学统计学- -全科全科1 1绪 论同质与变异o 同质:研究事物现象存在的共性,是统计学同质:研究事物现象存在的共性,是统计学的基础。的基础。o 同质:观察单位间被研究指标的影响因素相同质:观察单位间被研究指标的影响因素相同。同。o 变异:同质总体中,不同个体间的差异。变异:同质总体中,不同个体间的差异。总体与样本o 个体:观察单位,统计研究中的最基本单位。个体:观察单位,统计研究中的最基本单位。o 总体:根据研究目的确定的同质个体构成总总体:根据研究目的确定的同质个体构成总体体n 有限总体:有时间、空间、人群范围的限制有限总体:有时间、空间、人群范围的限制n 无限总体:无时间、空间
2、的限制无限总体:无时间、空间的限制1. 样本:从总体中样本:从总体中随机随机抽取的部分个体,构成抽取的部分个体,构成样本。样本。概率与频率o 频率:在相同条件下,重复频率:在相同条件下,重复n次试验,某随机事件次试验,某随机事件A发生的次数发生的次数X与与n次试验的比值,即为该事件发生次试验的比值,即为该事件发生的频率。的频率。oBuffon 4040次硬币次硬币 2048次正面次正面 频率:频率:0.5069o 概率:某随机事件发生可能性大小的度量。用概率:某随机事件发生可能性大小的度量。用P表表示。上述试验,当示。上述试验,当n逐渐增大时,频率始终在一个逐渐增大时,频率始终在一个常数左右微
3、小波动,这个常数就是概率。常数左右微小波动,这个常数就是概率。o 扔硬币的试验中,出现正面的概率为扔硬币的试验中,出现正面的概率为0.50.o 小概率事件,小概率事件,P0.05 参数与统计量o 参数:反映总体的统计指标参数:反映总体的统计指标o 统计量:反映样本的统计指标统计量:反映样本的统计指标变量(variable)与资料(data)o 观察或测量的个体(或观察单位)的某项特观察或测量的个体(或观察单位)的某项特征,称为变量。征,称为变量。o 如某地如某地7岁儿童的身高、体重等。岁儿童的身高、体重等。o 变量值构成资料。如,一组病人的血压值变量值构成资料。如,一组病人的血压值资料类型o
4、计量资料:表现为具体的数值、有度量衡单计量资料:表现为具体的数值、有度量衡单位,如血压、血糖等。位,如血压、血糖等。百分率资料:减分率百分率资料:减分率o 计数资料:观察指标是定性的,如阴性、阳计数资料:观察指标是定性的,如阴性、阳性,有病、无病等。二分类、多分类性,有病、无病等。二分类、多分类o 等级资料:尿糖检测结果的等级资料:尿糖检测结果的+ + + + +、治疗、治疗效果:痊愈、显效、有效、无效等效果:痊愈、显效、有效、无效等o 不同的资料类型可以相互转化不同的资料类型可以相互转化o 不同的资料类型有不同的统计分析方法不同的资料类型有不同的统计分析方法描述性统计描述性统计 (一)(一)
5、统计处理o 统计描述:统计描述: 描述样本特征:列表、图示、数字描述样本特征:列表、图示、数字o 统计推断:统计推断:计量资料分布特征和描述指标o 集中趋势:平均水平集中趋势:平均水平 算术均数、几何均数和中位数算术均数、几何均数和中位数o 离散趋势:变异性离散趋势:变异性 极差、四分位数间距、方差、标准差、变异极差、四分位数间距、方差、标准差、变异系数系数集中趋势指标-均数meano 算术均数:简称均数,用以描述一组服从正算术均数:简称均数,用以描述一组服从正态分布或近似正态分布资料的平均水平。态分布或近似正态分布资料的平均水平。o 总体均数总体均数 ,样本均数,样本均数o 离均差总和离均差
6、总和o 离均差平方和离均差平方和x几何均数G(geometric mean)o 用于对数正态分布的资料。即原变量值分布用于对数正态分布的资料。即原变量值分布不对称,但经对数转换后,近似或服从正态不对称,但经对数转换后,近似或服从正态分布的资料。分布的资料。o 血清学平均抗体效价血清学平均抗体效价中位数M(median)o 位置指标位置指标o 中位数:一组资料按大小顺序排列后,中间中位数:一组资料按大小顺序排列后,中间位置上的观测值。位置上的观测值。 1 2 3 4 5 6 7 1 2 3 4 5 6-median=3.5百分位数(percentile,Px)o 位置指标位置指标o 一组资料从小
7、到大排序后,一组资料从小到大排序后,x%的观测值比的观测值比Px小,(小,(100-x)%的观测值比的观测值比Px大,则这个大,则这个位置点的数值,即为第位置点的数值,即为第x百分位数百分位数Px。o 第第5百分位数百分位数P5:有:有5%的观测值比的观测值比P5小,有小,有95%的观测值比的观测值比P5大。大。o 中位数即第中位数即第50百分位数。百分位数。o 用于偏态分布的资料。用于偏态分布的资料。离散趋势的指标-极差Ro 极差或全距极差或全距range:最大值与最小值之差。:最大值与最小值之差。o 只考虑最大值和最小值,没有考虑所有的变只考虑最大值和最小值,没有考虑所有的变量。量。四分位
8、数间距Qo 第第25百分位数百分位数P25 ,第,第50百分位数百分位数P50,第第75百分位数百分位数P75,将所有的数据分为四份。将所有的数据分为四份。o P75- P25即为四分位数间距。即为四分位数间距。o 考虑了较多的变量信息,但信息利用仍不充考虑了较多的变量信息,但信息利用仍不充分。分。方差varianceo 方差方差:总体方差总体方差 ,样本方差,样本方差S2o 离均差平方和的平均值即为方差。离均差平方和的平均值即为方差。 2221()(1)niixxSn标准差SD/STD(standard deviation)o 方差开方即为标准差方差开方即为标准差o 求方差后,量纲为原量纲的
9、平方。求方差后,量纲为原量纲的平方。o 为使量纲恢复到原量纲,将方差开方,即为为使量纲恢复到原量纲,将方差开方,即为标准差。标准差。o 总体标准差总体标准差 ,样本标准差,样本标准差S变异系数CVo 用于比较不同量纲的变量的变异程度。用于比较不同量纲的变量的变异程度。o 无量纲无量纲100%SCVx小结o 上述指标都是用于计量资料的统计描述上述指标都是用于计量资料的统计描述o 除变异系数外,均有量纲除变异系数外,均有量纲o 变异性指标中,指标值越大,说明数据变异越大变异性指标中,指标值越大,说明数据变异越大o 分布类型不同,适用的描述指标不同。分布类型不同,适用的描述指标不同。o 正态分布常用
10、正态分布常用o 偏态分布常用中位数偏态分布常用中位数M和最小值、最大值或四分和最小值、最大值或四分位数间距。位数间距。 如:年龄中位数为如:年龄中位数为33.5岁,最小年龄岁,最小年龄3岁,最大年岁,最大年龄龄55岁。岁。xs计数资料的统计描述o 绝对数:实际观察所得绝对数:实际观察所得o 相对数:率、构成比、相对比相对数:率、构成比、相对比例题:2005年某市五地区糖尿病患病情况地区编号调查人数患病人数患病率(%)构成比(%)患病率相对比(%)(1)(2)(3)(4)(5)(6)A97776857.0121.52-B114106325.5419.8679.03C121816985.7321.
11、9281.74D103915415.2117.0074.32E105116275.9719.7085.16合计5427031835.87100.00-率(rate)o 说明在一定条件下,某现象发生的说明在一定条件下,某现象发生的频率或强度频率或强度。o K:比例基数,常用百分率(:比例基数,常用百分率(%)、千分率、)、千分率、万分率、十万分率等。万分率、十万分率等。o 使结果中保留使结果中保留1-2位小数;位小数;o 根据习惯用法根据习惯用法K实际发生某现象的观察单位数率可能发生该现象的观察单位总数常用的率o 发病率、患病率、死亡率、病死率等;发病率、患病率、死亡率、病死率等;o 发病率发病
12、率(incidence rate):一定期间内、一定人:一定期间内、一定人群中,某病群中,某病新病例新病例出现的频率。出现的频率。o 描述疾病的发生频率。描述疾病的发生频率。 k一定期间内某人群中某病新病例数发病率同时期可能发生该病的人口总数常用的率o 患病率(患病率(prevalence rate):现患率,某特定):现患率,某特定时间内总人口中,时间内总人口中,现患有某病的人(包括新和现患有某病的人(包括新和旧病例)旧病例)所占的比例。所占的比例。o 常用于表示病程较长的慢性病的发生或流行情常用于表示病程较长的慢性病的发生或流行情况。况。o 与发病率和病程有关。与发病率和病程有关。k某一时
13、点一定人群中现患某病新旧病例数患病率该时点的人口数常用的率o 死亡率(死亡率(mortality rate):一定期间内,):一定期间内,一定人群中,死于某病(或死于所有原因)一定人群中,死于某病(或死于所有原因)的频率。的频率。o 是测量人群死亡危险最常用的指标。是测量人群死亡危险最常用的指标。k某期间内(因某病)死亡总数死亡率同期平均人口数常用的率o 病死率病死率(fatality rate):表示一定时期内(通常:表示一定时期内(通常为为1年),年),患某病的全部病人患某病的全部病人中因中因该病死亡者该病死亡者的比例。的比例。o 用于表示确诊疾病的死亡概率,可表明疾病的用于表示确诊疾病的
14、死亡概率,可表明疾病的严重程度,也可反映医疗水平和诊断能力。多严重程度,也可反映医疗水平和诊断能力。多用于急性传染病,较少用于慢性病。用于急性传染病,较少用于慢性病。k某时期内因某病死亡总数病死率同期患某病的病人数常用的率o在临床实际中,要注意区分上在临床实际中,要注意区分上述四种常用率指标的含义,不述四种常用率指标的含义,不要混淆。要混淆。构成比(proportion)o 说明某一事物的内部各组成部分所占的比重说明某一事物的内部各组成部分所占的比重或分布。或分布。o 常用来表示疾病或死亡发生的分布情况,不常用来表示疾病或死亡发生的分布情况,不能表示其发生频率或严重程度。能表示其发生频率或严重
15、程度。100%事物内部某一组成部分的观察单位数构成比事物内部各组成部分观察单位总数比(ratio)o 又称相对比,表示两个有关的指标之比,可用又称相对比,表示两个有关的指标之比,可用倍数或百分数表示。倍数或百分数表示。o 甲乙两个指标可以是绝对数、相对数等;甲乙两个指标可以是绝对数、相对数等;o 性质可以相同,也可以不同。性质可以相同,也可以不同。o 如果计算时,分子大于分母,结果用倍数表示;如果计算时,分子大于分母,结果用倍数表示;反之,结果用百分数表示。反之,结果用百分数表示。甲指标比乙指标注意事项o 分母不宜过小:分母不宜过小:o 正确区分率与构成比的意义:正确区分率与构成比的意义:o
16、正确计算总率:即合计率或平均率。应将各正确计算总率:即合计率或平均率。应将各组实际发生某现象的观察单位数之和,除以组实际发生某现象的观察单位数之和,除以各组可能发生该现象的观察单位数之和,再各组可能发生该现象的观察单位数之和,再乘以比例基数乘以比例基数K。注意事项o 比较相对数指标时,注意资料的可比性:比较相对数指标时,注意资料的可比性:n随机化:随机抽样原则;随机化:随机抽样原则;n观察对象同质、研究方法相同、观察时间相等观察对象同质、研究方法相同、观察时间相等以及其他影响因素相同或接近;以及其他影响因素相同或接近;1. 观察对象的内部构成是否相同:即与比较指标观察对象的内部构成是否相同:即
17、与比较指标有关的影响因素在比较组间是否均衡。内部构有关的影响因素在比较组间是否均衡。内部构成不同时,需分层分析或进行标化。成不同时,需分层分析或进行标化。注意事项o 样本率(或构成比)的比较,要做假设检验:样本率(或构成比)的比较,要做假设检验:样本率或构成比存在抽样误差,相互比较时样本率或构成比存在抽样误差,相互比较时需要进行假设检验。需要进行假设检验。正态分布o 一种一种连续型随机变量连续型随机变量常见而重要的分布。常见而重要的分布。o 高斯分布:最初由德国数学家和天文学家德高斯分布:最初由德国数学家和天文学家德.莫阿弗尔于莫阿弗尔于1733年提出。但高斯将其迅速应年提出。但高斯将其迅速应
18、用到天文学中,并对其性质进行了进一步的用到天文学中,并对其性质进行了进一步的研究,因此又称为高斯分布。研究,因此又称为高斯分布。正态分布o 是自然界中最常见、最重要的一种连续型分是自然界中最常见、最重要的一种连续型分布,是许多统计分析方法的基础。布,是许多统计分析方法的基础。o 医学中很多数据都近似服从正态分布。医学中很多数据都近似服从正态分布。频数分布当样本量无限增大以及横 轴上的组距无限减小时,直方图外缘就变成一条光 滑的曲线,这条概率密度曲线所描述的分布就近似于正态分布。正态分布o 是两个常数,分别为圆周率(是两个常数,分别为圆周率(3.14159)和自然对数的底(近似于和自然对数的底(
19、近似于2.71828)o 是正态分布的两个参数,其中是正态分布的两个参数,其中 为为x的总的总体均数,体均数, 是是x的总体方差。的总体方差。o 和和 可以完全决定一个正态分布的形状,可以完全决定一个正态分布的形状,因此,对于一个正态分布,可记为因此,对于一个正态分布,可记为221()( )exp22xf xe22( ,)xN 正态分布的特征1、单峰分布,、单峰分布,以以x= 为中心,左右完全对称,为中心,左右完全对称,正态曲线以正态曲线以x轴为渐近线,两端与轴为渐近线,两端与x轴永不相轴永不相交。交。2、在、在x= 处有最大值,即此时曲线最高。处有最大值,即此时曲线最高。3、有两个参数:、有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 医学 统计学 精品 课件
限制150内