描述离散趋势的预期指数.ppt
第三讲 描述离散趋势的指标,Outline 主要内容,描述离散趋势的统计指标 描述分布形态的统计指标,只用平均数描述资料的弊病,甲组 26 29 30 31 34 均数30kg 乙组 24 27 30 33 36 均数30kg 丙组 26 28 30 32 34 均数30kg,平均数与变异度,平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征! 均数 描述离散趋势P75-P25,课后作业与思考题:,作业: 1、离散趋势指标的计算(书31页第1、2、3题) 思考题 1、离散趋势指标各自的适用条件是什么 ? 2、如何对定性指标进行描述?,本章结束,谢谢,卫生统计学,第三章定性资料的统计描述,关英辉 沈阳何氏医学院管理系,第四讲 相对数指标、医学人口统计描述,主要内容,三类相对数指标 医学人口统计常用的指标,一、常用的相对数指标,除了用频率分布全面反映一个定性变量外,有时,也可用其它相对数指标从某个侧面来描述定性变量。,相对数指标大致有三种类型: 频率 (Frequency)有的书称比率(Proportion) 强度 (intensity)有的书称速率(rate) 相对比 (ratio),(一) 频率型指标,频率型指标:最常见,近似地反映某一事件出现的机会大小, 如患病概率、病死概率等。 K是比例基数,取100%、1000、1万/1万和10万/10万 特点:分子是分母的一部分; 无量纲,在01范围内取值,(二)强度型指标,“强度”是流行病学、统计学术语 - 单位时段内某现象发生的频率。如,例3-3 在某医院的院内感染调查中,5031个病人共观察了127859人日(相当于127859人观察1日),其中有596人在医院发生感染。 观察人年数 =10日120人+9日240人+8日380人+ +3日890人+2日920人+1日1200人 =127859人日,平均每天有0.47%的病人将在医院发生感染。,一般地,,其中比例基数K同上。 分母含有“时间”,并不是一般的速率,而是单位时间内的频率。 统计学和流行病学本质:频率强度或概率强度的近似值。,(三)相对比型指标,任何两个相关联的变量A与B之比 相对于B的一个(或十个、百个、千个等)单位,A有多少个单位 A和B可以是绝对数,也可是相对数 A和B的量纲可以不同,也可相同,但A和B互不包含,(四)应用相对数应注意的事项,1. 防止概念混淆 不少指标命名混乱: “某某率”满天飞! 某些指标,实质上只是相对比,其名称却是 某某率; 更多指标以某某率的模式命名,笼统地称它 们为“率” -分不清究竟是频率还是强度,人口构成及其统计指标,发病率(incidence rate,IR): “时期”通常用年或月。发病率的分母泛指一般的观察人年数, 可由平均人口数1年来近似。 新发病例数:新发生某种疾病,以第一次就诊为准。 用于探讨疾病的危险因素,评价疾病防治效果。,2. 计算相对数时分母应有足够数量 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者5人,2人有效 有效频率均为40% !? 如果资料的总例数过少,计算得到的相对数 偏差可能会很大,直接报告原始数据更为可取: 甲医院有效率40% 乙医院有效 2/5,3. 正确地合并估计,例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者90人,30人有效 如果两医院总体有效率的确相等, 合并估计: 不可将两个频率相加除以2:,4. 相对数间的比较要具备可比性,注意以下几个方面: 观察对象 同质? 研究方法 相同? 观察时间 一致?,粗死亡率的定义式近似地写成,以上说明同样适用于年龄组死亡率、粗出生率和粗发病率等,不再赘述。,比较不同时期或不同地区的粗死亡率,如人口的年龄及性别分布不一致,应按性别、年龄标准化后作比较(见第14章)。,二、医学人口统计常用指标,一、医学人口统计资料的来源 二、人口数与人口构成 三、生育与计划生育统计 四、人口死亡统计,课后作业与思考题,作业: 1、频率指标和强度型指标有什么区别? (书47页1(1)题) 思考题: 1、还有哪些描述定性资料的指标?,本章结束,谢谢,第五讲 疾病统计指标、动态数列及其指标,主要内容,疾病统计常用指标 动态数列及其指标,一、疾病统计常用指标,疾病统计的意义 疾病统计资料的来源 疾病和死因分类 常用疾病统计指标,二、动态数列及其分析指标 表3-10 某大学1992-2002年本科专业招生动态变化,一、 绝对增长量 二、发展速度与增长速度 三、平均发展速度和平均增长速度,平均发展速度 = 环比的几何均数 平均增长速度 = 平均发展速度 1,预测2004年,前提:平均发展速度保持不变,a12满足 a12 = 1.04124200 = 6724人 根据该大学1992-2002年的平均发展速度,如果今后保持这个速度, 预计到2004年末学生人数可达6724人。 预测2040年?,本章小结,1 . 描述定性资料的相对数大致有三种类型: 频率型、强度型和相对比型 2. 实践中许多指标都称为XX率,要注意每个指标的定义和性质, 不可简单地望文生义。 3. 动态数列指标如发展速度和增长速度可描述事物在不同时期的发展水平和趋势。要注意:预测的前提条件是“平均发展速度保持不变”。,课后作业与思考题:,作业: 1、教材47页第1(5)、(7)题 思考题: 1、直观的统计描述方法是什么?,本章结束,谢谢,第六讲 常用统计图表,统计表(statistical table)与统计图(statistical chart)是应用广泛的统计描述方法。通过统计表和统计图可以对数据进行概括、对比或做直观的表达。,统计表(statistical table),将统计数值或统计指标用表格的形式列出 便于统计结果的精确、简洁的表达 便于对比分析 便于计算,统计表,1. 统计表的结构 2. 列表原则和要求 3. 统计表的种类 4. 不良统计表的修改举例,1.统计表的结构,2.列表原则和要求,标题:概括地指明表的内容,有时应包括时间、地点。多数场合标题应包括表的编号。标题位于统计表的最上部。 标目:分为纵标目与横标目。纵标目标示相应列的内容;横标目标示相应的行的内容,反映主要研究事物的标目应放在表左侧。 表线:不宜太多。不允许使用竖线与斜线。 表值: 表中的数字一律使用阿拉伯数字。同列数据小数位要相同。表内不应空格。不详的数据可用“”填充。不存在的数据应以“”号标明。零值应用“0”表示。 注释:一律列在表的下方,可用“*”号等符号标示。,3.统计表的种类,简单表:表中只有一个分组变量,一般作为横标目,而纵标目就是统计指标名称。 组合表:表中包含两个或两个以上分组变量,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。,简单表,表1 不同药物治疗急性冠周炎效果比较,组合表,4.不良统计表的修改举例,统计表制作是否良好,可以从以下几方面检查: 标题是否正确 标目的排列是否合适,是否组合重复。 表线是否过多过密。,4.不良统计表的修改,表2-1修改后的统计表,统计图(statistical chart),将统计数值或统计指标用图形的方式表达 作用:它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。,统计图,1.制图原则和要求 2.统计图的种类及绘制注意事项 3.不良统计图的修改举例,1.制图原则和要求,选图:按照资料的性质与分析目的恰当地选用图形。 标题: 以扼要说明统计图的内容(时间、地点等),位于图的正下方。 图例:对图中的不同事物应通过不同的图案或颜色加以区别,并附图例。图例位于图形与标题之间。 坐标轴: 横轴的方向应自左至右;纵轴的方向应自下而上。横轴与纵轴均应有标目。 表示量的数轴应标注合适的原点、尺度、单位;表示 分组的轴应标注组别。 为美观考虑,统计图的轮廓以高:宽=5:7为宜(近似黄金分割的比例)。,按照资料的性质与分析目的恰当地选用图形,直条图:性质相似而不连续的资料,用于表达不连续指标的数值大小 直方图:连续型变量资料的频数分布 百分条图:构成比资料,表示总体中各部分的比重 圆图:构成比资料,表示总体中各部分的比重 线图:连续型变量资料,适用于表达事物之间变化幅度的比较 半对数线图:连续型变量资料,适用于表达事物之间相对变化速度的比较 箱式图:连续型变量资料,用于多组数据的直观比较分析,标题,图例,坐标轴,2.统计图的种类及绘制注意事项,直条图 直方图 百分条图 圆图 线图 半对数线图 箱式图,1)直条图(bar graph),用等宽直条的长短来表示各独立指标大小。 适用资料:性质相似而不连续的资料。 有单式和复式两种,单式直条图 :一个分组因素,复式直条图:两个分组因素,绘制要点,坐标轴:纵轴为数值,必须从“0”开始,否则会改变各对 比组间的比例关系;横轴为观察项目,横轴各直条一般按 统计指标由从大到小,从小到大, 或按时间顺序排列。 直条:应等宽,等间距。复式直条图在同一观察项目的 各组之间无间距。,图2-8 直条图纵坐标应从零点开始,2)直方图(histogram),用矩形面积表示连续型变量的频数(频率)分布。 适用资料:连续型变量的资料,图2-2 120例健康成年男子血清铁含量分布(频率密度=频率/组距),图2-3 某地居民238人发汞含量分布 (频率密度=频率/组距),绘制要点,坐标轴 纵轴:频率密度(频率/组距),尺度从0开始。 横轴:连续型变量的组段。 各矩形条之间不留空隙。 矩形的高度为频数密度,宽度为组距。,以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例。 适用资料:构成比资料。,3)百分条图(percent bar graph),表2-8 两种脱落牙再植效果,绘制要点,标尺:一定要有标尺,画在图的上方或下方,起始的位置、总长度和百分条图一致,并和百分条图平行。 分段:按各部分所占百分比的大小排列,在图上标出百分比。 图例:在图外要附图例说明。 多组比较:若要比较的事物不止一个时,可以画几个平行的百分条图,以示比较。各条图的排列顺序相同,图例相同。,4)圆图(circle graph),以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例 。 用途与百分条图相同。但多组数据作比较,圆图的效果不如百分条图。 适用于构成比资料。,图2-10 嵌入性脱位牙的再植效果,绘制要点,先绘圆,将构成比乘以3.60,即得各构成部分所占的圆心角的度数。 以相当于时钟的9点、12点或3点的位置为起点依次排列各个扇形。 扇形内要注明简要文字和百分比。,5)线图(line graph),普通线图(line graph):用线段的升降表达事物之间变化幅度(绝对差)。 适用资料:连续型变量资料。 纵轴:算术尺度; 横轴:算术尺度,连续性变量(时间、年龄等) 半对数线图(semi-logarithmic line graph):表达事物之间相对变化速度的比较 (相对比)。 适用资料:连续型变量资料 纵轴:对数尺度; 横轴:算术尺度,连续性变量(时间、年龄等),普通线图,半对数线图,用于多组数据的直观比较分析,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。 一般选用五个描述统计量(最小值、P25、中位数、P75、最大值)来绘制 。 适用资料:连续型资料,6)箱式图(box plot),图2-13 两组动物每日进食量(mg/g)比较,按照资料的性质与分析目的恰当地选用图形,直条图:性质相似而不连续的资料,用于表达不连续指标的数值大小 直方图:连续型变量资料的频数分布 百分条图:构成比资料,表示总体中各部分的比重 圆图:构成比资料,表示总体中各部分的比重 线图:连续型变量资料,适用于表达事物之间变化幅度的比较 半对数线图:连续型变量资料,适用于表达事物之间相对变化速度的比较 箱式图:连续型变量资料,用于多组数据的直观比较分析,3.不良统计图的修改举例,图2-2 某地不同年度医院门诊量比较,总结:,定量资料的统计描述 图表描述: 统计量描述 集中趋势指标:均数、几何均数、中位数 离散趋势指标:标准差、四分位数间距、变异系数、极差 常见统计图表,