计量资料与计数资料的统计描述..ppt
第第3讲讲 计量与计数资料的统计描述计量与计数资料的统计描述医学统计学医学统计学(Medical Statistics)西南交通大学峨眉校区基础课部数学教研室西南交通大学峨眉校区基础课部数学教研室1一、数据类型的分类一、数据类型的分类二、计量资料的统计描述二、计量资料的统计描述三、三、SPSSSPSS实现计量资料的统计描述实现计量资料的统计描述四、计数资料的统计描述四、计数资料的统计描述五、统计表与统计图五、统计表与统计图本讲结构本讲结构 2一、数据类型的分类一、数据类型的分类1、计量资料、计量资料(measurement data)用仪器、工具等测量方法获得的数据,又称数值变量。用仪器、工具等测量方法获得的数据,又称数值变量。特点:特点:有计量单位,如患者的身高有计量单位,如患者的身高(cm),体重体重(kg),血压血压(kPa)等等.2、计数资料、计数资料(count data)按某种属性分类计数后得到的数据,又称无序分类变量,有二分按某种属性分类计数后得到的数据,又称无序分类变量,有二分类和多分类两种情形类和多分类两种情形.特点:特点:无计量单位,如肤色无计量单位,如肤色(黑白黑白)、血型、血型(ABO)、职业、职业(工农兵工农兵)、性别性别(男,女男,女)等等.3、等级资料、等级资料(ordinal data)半定性或半定量的观察结果,有大小顺序,又称有序分类变量半定性或半定量的观察结果,有大小顺序,又称有序分类变量.如如 癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。尿蛋白:尿蛋白:,+,+及以上及以上3住院号住院号年龄年龄身高身高体重体重住院住院天数天数职业职业文化文化程度程度分娩分娩方式方式妊娠妊娠结局结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产20194642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月实例数据实例数据实例数据实例数据计量资料计量资料计数资料计数资料4三类资料间关系三类资料间关系三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级等级资料资料计数资料计数资料5二、计量资料的统计描述二、计量资料的统计描述1、频数分布、频数分布(frequency distribution)为了了解数据的分布情况为了了解数据的分布情况,可以编制频数表可以编制频数表(frequency table).(1)求)求极差极差(range):即最大值与最小值之差,又称为全距。:即最大值与最小值之差,又称为全距。(2)数据)数据分组分组:由样本容量由样本容量n确定确定组数、组数、通常分通常分10-15个组个组;一般采取等距分一般采取等距分组组,组距组距=极差极差/组数。组数。(3)列出)列出组段组段:第一组段的下限略小于最小值,最后一个组段上限必须包:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。含最大值,其它组段上限值忽略。(4)划记)划记计数计数:用划记法将所有数据归纳到各组段,得到各组段的频数。:用划记法将所有数据归纳到各组段,得到各组段的频数。l 频数表的编制步骤频数表的编制步骤6编号编号血清甘油三脂血清甘油三脂编号编号血清甘油三脂血清甘油三脂1 10.510.512 20.520.521531531.651.653 30.590.591541541.661.664 40.610.611551551.671.675 50.610.611561561.671.676 60.620.621571571.691.697 70.630.631581581.71.78 80.640.641591591.711.711601601.771.77 表表2-1:1602-1:160名正常成年女子的血清甘油三酯(名正常成年女子的血清甘油三酯(mmol/Lmmol/L)7 组段组段 (1)划划 记记(2)频数,频数,f(3)组中值,组中值,X(4)fX(5)=(3)(4)0.5 30.551.650.6正正90.655.850.7正正正正120.759.000.8正正正正130.8511.050.9正正正正正正170.9516.151.0正正正正正正181.0518.901.1正正正正正正正正201.1523.001.2正正正正正正181.2522.501.3正正正正正正171.3522.951.4正正正正131.4518.851.5正正91.5512.401.6正正 81.6514.851.71.8 合计合计 31.755.25160182.30编制频数表编制频数表,绘制频数分布图绘制频数分布图8对称分布:对称分布:以频数最多组段为中心左右以频数最多组段为中心左右大体对称大体对称.右右(正正)偏态分布偏态分布:频数最多组段右侧组频数最多组段右侧组段数多段数多.(skewed to the right distribution)左左(负负)偏态分布偏态分布:频数最多组段左侧组频数最多组段左侧组段数多段数多.(skewed to the right distribution)92、集中趋势的描述、集中趋势的描述 统计上使用平均数统计上使用平均数(average)来反映计量资料的集中趋来反映计量资料的集中趋势势(central tendency).常用平均数有:常用平均数有:1.算术均数算术均数(arithmetic mean),简称,简称均数均数(mean)2.几何均数几何均数(geometric mean)3.中位数中位数(median)4.百分位数百分位数(percentile)103、离散趋势的描述、离散趋势的描述 反映数据的离散度反映数据的离散度(Dispersion),即个体观察值的变异即个体观察值的变异(variation)程度程度,常用的统计指标有:常用的统计指标有:1.极差极差(Range)(全距全距)2.四分位数间距四分位数间距(Quartile range)3.方差方差(Variance)4.标准差标准差(Standard Deviation)5.变异系数变异系数(Coefficient of Variation)四分位间距:四分位间距:QRP75 P2511三、三、SPSS实现计量资料的统计描述实现计量资料的统计描述1213四、计数资料的统计描述四、计数资料的统计描述住院号住院号年龄年龄职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局202565527无无中学中学顺产顺产足月足月202565322无无小学小学助产助产足月足月202583025管理人员管理人员大学大学顺产顺产足月足月202567724知识分子知识分子中学中学顺产顺产早产早产202564730管理人员管理人员大学大学顺产顺产足月足月202584832无无小学小学剖宫产剖宫产足月足月201991527无无中学中学顺产顺产死产死产202586129无无大学大学剖宫产剖宫产足月足月202460125农民农民中学中学顺产顺产足月足月200038626无无小学小学顺产顺产足月足月1、计数资料数据的整理、计数资料数据的整理14按年龄(按年龄(2 2岁一组)与职业整理岁一组)与职业整理年龄年龄工人工人管理人员管理人员农民农民商业服务商业服务无无知识分子知识分子总计总计1818 2 2 0 0 0 0 0 0 3 3 0 0 5 52020 9 9 2 2 6 61010 1818 0 0 454522222828 7 710102424 7070111115015024245050343428285252153153444436136126265050434325254545133133707036636628283434353510103434 7878575724824830301111141411112222 3939171711411432321414 2 2 3 31414 2424 3 3 60603434 4 4 2 2 5 5 3 3 1212 2 2 28283636 2 2 1 1 1 1 4 4 5 5 1 1 14143838 3 3 1 1 1 1 0 0 2 2 1 1 8 84040 0 0 0 0 2 2 0 0 0 0 0 0 2 2合计合计 207207 14114110210220820853753720620614011401152、常用相对数指标、常用相对数指标 计数资料常用的数据形式是绝对数计数资料常用的数据形式是绝对数,如某病的出院人数如某病的出院人数,治愈人数治愈人数等等.但绝对数不具可比性但绝对数不具可比性,需要计算相对数需要计算相对数.l率(率(raterate):说明某现象或某事物发生的频率或强度。说明某现象或某事物发生的频率或强度。率率=(实际发生数(实际发生数/可能发生总数)可能发生总数)比例基数比例基数 比例基数:比例基数:100%100%、10001000、10000/10000/万、万、100000100000(1/101/10万)等万)等 如:发病率、死亡率、发生率、阳性率、患病率等如:发病率、死亡率、发生率、阳性率、患病率等l构成比(构成比(proportionproportion):说明某一事物内部,各组成部分所占的比:说明某一事物内部,各组成部分所占的比重重,也叫百分比。也叫百分比。构成比构成比=(某部分观察单位数(某部分观察单位数/各组成部分观察单位总数)各组成部分观察单位总数)100%100%如:教研室如:教研室2020人人中高级职称有中高级职称有5 5人,占人,占2525。l相对比(相对比(relative ratiorelative ratio):是:是A A、B B两个有关指标之比,说明两个有关指标之比,说明A A是是B B的若干倍或百分之几,通常用倍数或分的若干倍或百分之几,通常用倍数或分数表示。数表示。如:男:女、医生:如:男:女、医生:护士、教师:学生护士、教师:学生16 年龄组年龄组 受检人数受检人数白内障白内障例数例数 患者年龄患者年龄构成比(构成比(%)患病率(患病率(%)=(3)/(2)4050607080合计合计560441296149 2268129135 97 1915.1828.7930.1321.65 4.2412.1429.2545.6165.1086.36 1468448100.0030.52例例:率与构成比率与构成比17(1)不能以构成比代替率。不能以构成比代替率。(2)计算相对数的分母不宜过小计算相对数的分母不宜过小,小则直接叙述。小则直接叙述。(3)进行率的对比分析时,应注意资料可比性。如比较疗进行率的对比分析时,应注意资料可比性。如比较疗效时,比较组间应病情轻重相同,性别影响,应按性别效时,比较组间应病情轻重相同,性别影响,应按性别分组后再作比较。分组后再作比较。(4)正确求平均率。正确求平均率。例:例:若若P1=x1/n1 P2=x2/n2 P3=x3/n3 P(x1+x2+x3)/n1+n2+n3)(正确正确)P(P1+P2+P3)/3 (错误错误)3、相对数应用注意事项、相对数应用注意事项18计数资料和等级资料的计数资料和等级资料的SPSS表示表示19五、统计表与统计图五、统计表与统计图 统计表统计表(statistical table)(statistical table)数据代替文字描述数据代替文字描述,便于便于统计结果的精确统计结果的精确、简洁的、简洁的表达和对比分析表达和对比分析.统计图统计图(statistical chart)(statistical chart)用图形代替数据,获得直用图形代替数据,获得直观、形象的效果观、形象的效果.定义定义:将统计分析的事物及指将统计分析的事物及指标用表格列出标用表格列出.特点特点:避免长篇文字叙述避免长篇文字叙述,便于便于阅读和对比分析阅读和对比分析;数据具体数据具体.定义定义:用点的位置用点的位置,线段的升降线段的升降,直条的长短或面积的大小等直条的长短或面积的大小等形式表达统计资料形式表达统计资料.特点特点:直观直观,醒目醒目,常给人以深常给人以深刻印象刻印象.20统计表由以下几个部分组成统计表由以下几个部分组成:标题、标题、标目、标目、线条、线条、数字、数字、备注备注表表2-9 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率检测检测指标指标1994年年1998年年受检人数受检人数 异常人数异常人数 检出率检出率(%)受检人数受检人数异常人数异常人数检出率检出率(%)血压血压 心率心率 TTT GPT 5195195195195544362010.16 0.48 6.94 3.85582582582582383923166.526.703.952.75 :TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。(丁建生等.中国卫生统计 1999;16(3):166)1、统计表的结构、统计表的结构21.纵纵 标标 目目总总 标标 目(单位)目(单位).合合 计计 .横横 标标 目目纵纵 标标 目目纵纵 标标 目目纵纵 标标 目目总总 标标 目目横标目的横标目的总总 标标 目目备注:备注:表号表号 标题(包括何时、何地、何事)标题(包括何时、何地、何事)2、三线表、三线表22 根据分组标目的复杂程度,统计表可大致分为根据分组标目的复杂程度,统计表可大致分为简单表简单表和和复合表复合表。简单表简单表(simple table)(simple table):只按一个特征或标志分组。只按一个特征或标志分组。如表如表2-8 2-8。复合表复合表(combinative table)(combinative table):按两个或两个以上特按两个或两个以上特征或标志结合起来分组。如表征或标志结合起来分组。如表2-92-9。3、统计表的分类、统计表的分类233、不良统计表的修改、不良统计表的修改24 统计图统计图(statistical chart(statistical chart 或或statistical statistical graph)graph)是用点、线、面等几何图形,直观形象地表达、是用点、线、面等几何图形,直观形象地表达、描述数据或结果。描述数据或结果。3、统计图、统计图25 SPSS绘制基本图形绘制基本图形2627条形图条形图(Bar Chart)(Bar Chart)用途:用途:用等宽直条的长短来表示相互独立的各统计用等宽直条的长短来表示相互独立的各统计指标的数值大小指标的数值大小,也叫直条图也叫直条图.分单式和复式两种分单式和复式两种.28单式条形图单式条形图复式条形图复式条形图29圆图圆图(Pie(Pie Chart)Chart)用途:用途:以圆的半径将圆面分割成多个大小不等的以圆的半径将圆面分割成多个大小不等的扇形,以扇形面积来表达构成比的图形。扇形,以扇形面积来表达构成比的图形。30线图线图(Line Chart)(Line Chart)用途:用途:适用于连续变量资料,说明某事物因时间、适用于连续变量资料,说明某事物因时间、条件推移而变迁的趋势。条件推移而变迁的趋势。31直方图直方图(Histogram)(Histogram)用途:用途:直方图是以面积表示数量,适用于表达连直方图是以面积表示数量,适用于表达连续性资料的频数或频率分布。续性资料的频数或频率分布。32