计量资料与计数资料的统计描述..ppt
《计量资料与计数资料的统计描述..ppt》由会员分享,可在线阅读,更多相关《计量资料与计数资料的统计描述..ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3讲讲 计量与计数资料的统计描述计量与计数资料的统计描述医学统计学医学统计学(Medical Statistics)西南交通大学峨眉校区基础课部数学教研室西南交通大学峨眉校区基础课部数学教研室1一、数据类型的分类一、数据类型的分类二、计量资料的统计描述二、计量资料的统计描述三、三、SPSSSPSS实现计量资料的统计描述实现计量资料的统计描述四、计数资料的统计描述四、计数资料的统计描述五、统计表与统计图五、统计表与统计图本讲结构本讲结构 2一、数据类型的分类一、数据类型的分类1、计量资料、计量资料(measurement data)用仪器、工具等测量方法获得的数据,又称数值变量。用仪器、工具
2、等测量方法获得的数据,又称数值变量。特点:特点:有计量单位,如患者的身高有计量单位,如患者的身高(cm),体重体重(kg),血压血压(kPa)等等.2、计数资料、计数资料(count data)按某种属性分类计数后得到的数据,又称无序分类变量,有二分按某种属性分类计数后得到的数据,又称无序分类变量,有二分类和多分类两种情形类和多分类两种情形.特点:特点:无计量单位,如肤色无计量单位,如肤色(黑白黑白)、血型、血型(ABO)、职业、职业(工农兵工农兵)、性别性别(男,女男,女)等等.3、等级资料、等级资料(ordinal data)半定性或半定量的观察结果,有大小顺序,又称有序分类变量半定性或半
3、定量的观察结果,有大小顺序,又称有序分类变量.如如 癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。尿蛋白:尿蛋白:,+,+及以上及以上3住院号住院号年龄年龄身高身高体重体重住院住院天数天数职业职业文化文化程度程度分娩分娩方式方式妊娠妊娠结局结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.
4、011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产20194642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月实例数据实例数据实例数据实例数据计量资料计量资料计数资料计数资料4三类资料间关系三类资料间关系三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8
5、正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级等级资料资料计数资料计数资料5二、计量资料的统计描述二、计量资料的统计描述1、频数分布、频数分布(frequency distribution)为了了解数据的分布情况为了了解数据的分布情况,可以编制频数表可以编制频数表(frequency table).(1)求)求极差极差(range):即最大值与最小值之差,又称为全距。:即最大值与最小值之差,又称为全距。(2)数据)数据分组分组:由样本容量由样本容量n确定确定组数、组数、通常分通常分10-15个组个组;一般采取
6、等距分一般采取等距分组组,组距组距=极差极差/组数。组数。(3)列出)列出组段组段:第一组段的下限略小于最小值,最后一个组段上限必须包:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。含最大值,其它组段上限值忽略。(4)划记)划记计数计数:用划记法将所有数据归纳到各组段,得到各组段的频数。:用划记法将所有数据归纳到各组段,得到各组段的频数。l 频数表的编制步骤频数表的编制步骤6编号编号血清甘油三脂血清甘油三脂编号编号血清甘油三脂血清甘油三脂1 10.510.512 20.520.521531531.651.653 30.590.591541541.661.664
7、 40.610.611551551.671.675 50.610.611561561.671.676 60.620.621571571.691.697 70.630.631581581.71.78 80.640.641591591.711.711601601.771.77 表表2-1:1602-1:160名正常成年女子的血清甘油三酯(名正常成年女子的血清甘油三酯(mmol/Lmmol/L)7 组段组段 (1)划划 记记(2)频数,频数,f(3)组中值,组中值,X(4)fX(5)=(3)(4)0.5 30.551.650.6正正90.655.850.7正正正正120.759.000.8正正正正1
8、30.8511.050.9正正正正正正170.9516.151.0正正正正正正181.0518.901.1正正正正正正正正201.1523.001.2正正正正正正181.2522.501.3正正正正正正171.3522.951.4正正正正131.4518.851.5正正91.5512.401.6正正 81.6514.851.71.8 合计合计 31.755.25160182.30编制频数表编制频数表,绘制频数分布图绘制频数分布图8对称分布:对称分布:以频数最多组段为中心左右以频数最多组段为中心左右大体对称大体对称.右右(正正)偏态分布偏态分布:频数最多组段右侧组频数最多组段右侧组段数多段数多.
9、(skewed to the right distribution)左左(负负)偏态分布偏态分布:频数最多组段左侧组频数最多组段左侧组段数多段数多.(skewed to the right distribution)92、集中趋势的描述、集中趋势的描述 统计上使用平均数统计上使用平均数(average)来反映计量资料的集中趋来反映计量资料的集中趋势势(central tendency).常用平均数有:常用平均数有:1.算术均数算术均数(arithmetic mean),简称,简称均数均数(mean)2.几何均数几何均数(geometric mean)3.中位数中位数(median)4.百分位数
10、百分位数(percentile)103、离散趋势的描述、离散趋势的描述 反映数据的离散度反映数据的离散度(Dispersion),即个体观察值的变异即个体观察值的变异(variation)程度程度,常用的统计指标有:常用的统计指标有:1.极差极差(Range)(全距全距)2.四分位数间距四分位数间距(Quartile range)3.方差方差(Variance)4.标准差标准差(Standard Deviation)5.变异系数变异系数(Coefficient of Variation)四分位间距:四分位间距:QRP75 P2511三、三、SPSS实现计量资料的统计描述实现计量资料的统计描述1
11、213四、计数资料的统计描述四、计数资料的统计描述住院号住院号年龄年龄职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局202565527无无中学中学顺产顺产足月足月202565322无无小学小学助产助产足月足月202583025管理人员管理人员大学大学顺产顺产足月足月202567724知识分子知识分子中学中学顺产顺产早产早产202564730管理人员管理人员大学大学顺产顺产足月足月202584832无无小学小学剖宫产剖宫产足月足月201991527无无中学中学顺产顺产死产死产202586129无无大学大学剖宫产剖宫产足月足月202460125农民农民中学中学顺产顺产足月足月200038
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 计数 统计 描述
限制150内