常用医学统计方法--胡国清.ppt
《常用医学统计方法--胡国清.ppt》由会员分享,可在线阅读,更多相关《常用医学统计方法--胡国清.ppt(101页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用医学统计分析方法基本知识常用医学统计分析方法基本知识胡国清胡国清 副教授副教授中南大学公共卫生学院流行病与卫生统计学系2023/7/41一一.统计学应用中的常见误区统计学应用中的常见误区2023/7/42问题1:统计学是数字游戏?数字形式仅是表面现象。几个示例统计学(Statistics):是一门研究数据的搜集、整理、是一门研究数据的搜集、整理、分析的科学。更主要的是分析的科学。更主要的是帮助人类探索未知事物帮助人类探索未知事物规律的工具规律的工具。统计学存在的必要性统计学存在的必要性?2023/7/43几个例子2003年湖南省省级计划生育工作的人员总数;2003年在湘雅医院出生的新生儿的
2、平均体重;2003年中国艾滋病发病率;湖南省65岁以上人群的平均血压;返回2023/7/44三个原因人类要了解未知事物的特点或规律人类要了解未知事物的特点或规律;如SARS的病因研究,一些恶性肿瘤的治疗方法探索,一些疾病的预防等等;差异或变异在研究总体中存在的普遍性差异或变异在研究总体中存在的普遍性;如全国正常人群的体重、身高、血压测量值等等。数据的表达或描述的难度。人、财、物的限制,不能够调查或检查总体中人、财、物的限制,不能够调查或检查总体中所有的观察单位,代价太大所有的观察单位,代价太大。2023/7/45留给统计学的问题如何简洁地、准确地从一大批杂乱无章的数据中提炼出代表性信息?(统计
3、描述)如何合理地由样本的信息(部分信息)推断总体的信息(总体信息)?(统计推断)2023/7/46统计方法的主要应用1.通过种种手段以最合适的方法搜集数据。2.采用统计指标、统计表、统计图描述数据的规律。3.采用合适的统计方法对数据进行分析,对整个研究的结果下结论。2023/7/47问题2:数据被恰当地表达了吗?1.统计指标的使用准确吗?还是?各自使用的条件是什么?是万用通行证吗?率与构成比 搞清楚了吗?如此计算率合适吗?2.统计表正确吗?3.统计图正确吗?2023/7/482023/7/49集中趋势的描述集中趋势的描述平均数平均数:描述一组变量值的集中位置或平均水平的指标体系。1.(算术)均
4、数:对称分布,尤其是正态分布;2.几何均数:对数转换后呈对称分布,尤其是对数正态分布;3.中位数:一般偏态分布;2023/7/410离散趋势描述离散趋势描述:描述一组变量值的离散趋势或变异程度的指标体系。1.极差:任何计量资料,是参考变异指标2.四分位数间距:与中位数配套用3.标准差:与算术均数配套用4.变异系数:描述对称分布(特别是正态分布)资料的相对变异程度。2023/7/411示例1:率和构成比的区分2023/7/412 示例2:如某种疗法治疗5例病人5例全部治愈,则计算治愈率为5/5100%=100%,若4例治愈,则治愈率为4/5100%=80%,由100%至80%波动幅度较大,但实际
5、上只有1例的变化。2023/7/413表10-3 不同心理分值的冠心病危险因素水平比较 2023/7/414统计图的误导作用 直条图的纵轴尺度起点必须为零示意图2023/7/415问题3:t检验、卡方检验是万能的吗?正态分布、方差齐性的条件满足了吗?是t检验还是方差分析;是t检验还是U检验?是成组t检验还是配对t检验?是t检验,还是校正t检验,或者是非参数检验?对于计数资料,是通常的卡方检验,还是Yates校正检验,或是精确概率检验?是配对设计,还是成组设计的四格表资料?2023/7/416误区4:统计检验决定论与统计无用论P值一定要小于0.05或者0.01才行吗?P值的决定因素您考虑了哪几个
6、?统计检验判断结果与专业判断结果相比,哪个更重要?2023/7/4172.2.数据特征与统计描述基本知识数据特征与统计描述基本知识 2023/7/418计量资料的常用统计指标计量资料的常用统计指标描述集中趋势的特征数(描述集中趋势的特征数(选代表选代表)描述离散趋势的特征数(描述离散趋势的特征数(代表程度代表程度)目的:简单、明了传达信息目的:简单、明了传达信息2023/7/419表表 某地某地150名正常成年男子红细胞数(名正常成年男子红细胞数(1012/L)编号编号红细胞数红细胞数编号编号红细胞数红细胞数1 13.983.982 24.544.541431434.674.673 34.74
7、4.741441445.405.404 45.135.131451455.295.295 54.434.431461464.774.776 64.814.811471475.385.387 74.984.981481485.155.158 83.793.791491494.644.641501505.195.19问题:谁能一眼看出下述数据的分布规律?2023/7/420一、一、描述集中趋势的特征数(描述集中趋势的特征数(平均指标)平均指标)总称为平均数(average)反映了资料的集中趋势(central tendency)。常用的有:1.算术均数(arithmetic mean),简称均数(
8、mean)2.几何均数(geometric mean)3.中位数(median)2023/7/4211.1.算术均数(算术均数(meanmean)符号:总体 样本适用条件:资料呈对称分布,尤其是正态或近似正态。计算:(1)直接法(2)频数表法2.2.几何均数(几何均数(geometric meangeometric mean)适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料。2023/7/423几何均数的示例几何均数的示例血清的抗体效价滴度的倒数倒数分别为:10、100、1000、10000、100000,求几何均数。此例的算术均数为22222问题:描述此类型资料集中
9、趋势时,为什么倾向选用几何均数?2023/7/424频数表资料的几何均数频数表资料的几何均数抗体滴度抗体滴度 人数人数,f 滴度倒数滴度倒数,X lgX flgX 1:41:81:161:321:512 合计合计15625724816325120.60210.90311.20411.50512.70930.60214.51557.22463.010213.5465 72.2471 2023/7/4253.3.中位数(中位数(medianmedian)定义:是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。符号:Md/M 适用条件:适合各种类型的资料。尤其适合于大样本
10、偏态分布的资料;资料有不确定数值;资料分布不明等。2023/7/426中位数计算公式中位数计算公式先将观察值按从小到大顺序排列,按以下公式计算:注意:公式中n的含义,数据自小到大排序后的编号。2023/7/427频数表资料的中位数频数表资料的中位数下限值下限值L上限值上限值Ui;fm中位数中位数Md2023/7/428潜伏期潜伏期/h(1)频频数,数,f(2)累累计频计频数数S Sf所占百分比所占百分比(3)0171212646434312387070183292922469696300969636499994248 合计合计2100100145例4-8中位数12+6x(145x50%63)/
11、3813.5(h)2023/7/429小结:集中趋势的描述平均数 平均数:描述一组变量值的集中位置或平均水平的指标体系。不同的分布使用不同的指标 算术)均数:正态或近似正态分布的资料 几何均数:对数正态分布或等比级数资料 中位数:一般偏态分布2023/7/430离散趋势的特征数离散趋势的特征数常用指标有:1.极差或全距(Range)2.四分位数间距(Quartile range)3.方差(Variance)4.标准差(Standard Deviation)5.变异系数(Coefficient of Variation)考试要点:表示符号、定义、适用条件、区别2023/7/431 盘编号盘编号
12、甲甲乙乙丙丙1 14404804902 24604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙2023/7/4321.1.极差极差(Range(Range)(全距全距)符号:R意义:反映全部变量值的变动范围。优点:简便缺点:只利用了两个观测值适用范围:任何计量资料2023/7/4332.2.四分位数间距四分位数间距百分位数百分位数 :数据从:数据从小到大小到
13、大 排列排列;在百分在百分尺度下,所占百分比尺度下,所占百分比对应的值。记为对应的值。记为P Px x。四分位间距四分位间距:Q QP P7575 P P2525 P100(max)P75P50(中位数中位数)P25P0(min)Px2023/7/434频数表资料的百分位数频数表资料的百分位数下限值下限值L上限值上限值Ui;fm百分位数百分位数Px2023/7/435P256+6x(145x25%17)/468.51(h)P7518+6x(145x75%101)/3219.45(h)Q19.45-8.5110.94(h)潜伏期潜伏期/h(1)频频数,数,f(2)累累计频计频数数S Sf所占百分
14、比所占百分比(3)0171212646434312387070183292922469696300969636499994248 合计合计21001001452023/7/436百分位数的应用百分位数的应用可用多个百分位数可用多个百分位数描述计量资料的分布特征描述计量资料的分布特征2023/7/4373.3.方差方差方差(variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。2023/7/438方差的优点和缺点方差的优点和缺点优点:利用了所有的观测数值。缺点:容易受极大值或极小值的影响;单位与原观测单位不一致。2
15、023/7/4394.4.标准差标准差标准差(standard deviation)即方差的正平方根;其单位与原变量X的单位相同。2023/7/440标准差的计算标准差的计算盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 21 14404804901936002304002401002 24604904952116002401002450253 35005005002500002500002500004 45405105052916002601002550255 5560520510313600270400260100合计合计250025002500250025002500 126040
16、012510001250250标准差标准差50.9915.817.912023/7/4415.变异系数变异系数(coefficient of variation)适用条件适用条件:观察指标单位不同,如身高、体重观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊均数均数 标准差标准差变异系数变异系数青年男子青年男子 身高身高170 cm170 cm6 cm6 cm3.53.5体重体重60 kg60 kg7 kg7 kg11.711.7 意义:意义:挑选指标时变异系数越小,指标越好。2023/7/442变异指标小结变异指标小结1极差较粗,适合于任何分布2标准差与均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 医学 统计 方法 胡国清
限制150内