(第2章)计量资料的统计描述1(精品).ppt
《(第2章)计量资料的统计描述1(精品).ppt》由会员分享,可在线阅读,更多相关《(第2章)计量资料的统计描述1(精品).ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第一篇第一篇 基本统计方法基本统计方法 第二章第二章 计量资料的统计描述计量资料的统计描述 第二军医大学卫生统计学教研室第二军医大学卫生统计学教研室 孟孟 虹虹 本章的内容和重点本章的内容和重点第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节 离散趋势的描述离散趋势的描述第四节第四节 正态分布正态分布第五节第五节 医学参考值的制定医学参考值的制定重点重点:掌握概念、方法的用途和适用条件掌握概念、方法的用途和适用条件 熟悉统计符号和公式熟悉统计符号和公式 统计描述的意义统计描述的意义 社会活动看似杂乱无章,对个体来说社会活动看似杂乱无章,对个体来说有很多不确
2、定性,但总体上都是服从一些有很多不确定性,但总体上都是服从一些统计规律的。统计规律的。医学工作有很多数据,统计学描述就医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、是对这些数据进行加工和提炼,找出规律、预测未知。预测未知。统计描述是最简洁有力的语言。统计描述是最简洁有力的语言。概念:即用少量几个统计指标刻画出原始数概念:即用少量几个统计指标刻画出原始数据的特征称为据的特征称为统计描述统计描述。计量资料的统计描述计量资料的统计描述方法方法:(单变量单变量)1.通过频数表描述数据特征通过频数表描述数据特征 2.用统计指标用统计指标 定量描述数据的特征。定量描述数据的特征。表
3、表 100例高血压患者治疗后临床记录例高血压患者治疗后临床记录编号编号编号编号 年龄年龄年龄年龄 性别性别性别性别 治疗组治疗组治疗组治疗组 舒张压舒张压舒张压舒张压 体温体温体温体温 疗效疗效疗效疗效 X1 X1 X1 X1 X2X2X2X2 X3 X3 X3 X3 X4 X5X4 X5X4 X5X4 X5 X6X6X6X6 1 37 1 37 男男男男 A 11.27 37.5 A 11.27 37.5 显效显效显效显效 2 45 2 45 女女女女 B 12.53 37.0 B 12.53 37.0 有效有效有效有效 3 43 3 43 男男男男 A 10.93 36.5 A 10.93
4、 36.5 有效有效有效有效 4 59 4 59 女女女女 B 14.67 37.8 B 14.67 37.8 无效无效无效无效 100 54 100 54 男男男男 B 16.80 37.6 B 16.80 37.6 无效无效无效无效 一一、频数分布表、频数分布表频数分布表:将变量值分为不同数量的频数分布表:将变量值分为不同数量的组段,清点各组段的例数。组段,清点各组段的例数。意义:概括了解变量值在各组段的意义:概括了解变量值在各组段的分布分布和规律和规律。例:表2-1 例例2-1 从某单位从某单位1999年的职工体检资料中获得年的职工体检资料中获得101名正常成年女子的血清总胆固醇(名正常
5、成年女子的血清总胆固醇(mmol/L)的测量结果)的测量结果 2.352.354.214.213.323.325.355.354.174.174.134.132.782.784.264.263.583.584.344.344.844.844.414.414.784.783.953.953.923.923.583.583.663.664.284.283.263.263.53.52.72.74.614.614.754.752.912.913.913.914.594.594.194.192.682.684.524.524.914.913.183.183.683.684.834.833.873.873
6、.953.953.913.914.154.154.554.554.84.83.413.414.124.123.953.955.085.084.534.533.923.923.583.585.355.353.843.843.63.63.513.514.064.063.073.073.553.554.234.233.573.574.834.833.523.523.843.844.54.53.963.964.54.53.273.274.524.523.193.194.594.593.753.753.983.984.134.134.264.263.633.633.873.875.715.713.33.
7、34.734.734.174.175.135.133.783.784.574.573.83.83.933.933.783.783.993.994.484.484.284.284.064.065.265.265.255.253.983.985.035.033.513.513.863.863.023.023.73.74.334.333.293.293.253.254.154.154.364.364.954.953.003.003.263.26例例2-1数据数据 1.确定全距(确定全距(R)=最大值最大值 最小值最小值2.定组数(定组数(8-15组)和组距:组)和组距:例例:3.36/10=0.33
8、60.33.写出组段的下限:第写出组段的下限:第1组段值小于或等于最组段值小于或等于最小变量值,并以整数(小变量值,并以整数(0,5或或2,4,6,8)较好。如)较好。如2.34.划计并计数:变量(划计并计数:变量(x)归为)归为L xU(见(见表表2-1)组距(组距(i)=全距(全距(R)/组数组数表表2-1 101名正常成年女性血清总胆固醇频数表名正常成年女性血清总胆固醇频数表 组段组段组段组段 频数(频数(频数(频数(f f)f f(%)2.3-1 1.02.3-1 1.0 2.6-3 3.0 2.6-3 3.0 2.9-6 6.0 2.9-6 6.0 3.2-8 8.0 3.2-8 8
9、.0 3.5-17 17.0 3.5-17 17.0 3.8-20 20.0 3.8-20 20.0 4.1-17 17.0 4.1-17 17.0 4.4-12 12.0 4.4-12 12.0 4.7-9 9.0 4.7-9 9.0 5.0-5 5.0 5.0-5 5.0 5.3-2 2.0 5.3-2 2.0 5.6-5.9 1 1.0 5.6-5.9 1 1.0 合计合计合计合计 101 100.0101 100.0二二 频数表及分布图的用途频数表及分布图的用途1.通过通过频数表了解频数表了解数据的分布特征数据的分布特征。X值分布情况:偏态或正态分布值分布情况:偏态或正态分布 取值情况
10、:变量值取值范围取值情况:变量值取值范围 集中趋势:变量值集中位置。集中趋势:变量值集中位置。2.便于发现资料中的可疑值。便于发现资料中的可疑值。3.组段的频率作为概率的估计。组段的频率作为概率的估计。例:例:表表2-1资料频数分布图资料频数分布图直方图直方图图图2-1 101名正常成年女性血清总胆固醇频数分布名正常成年女性血清总胆固醇频数分布频频数数血清总血清总胆固醇胆固醇正态分布正态分布图图2-2 59名链球菌咽喉炎患者潜伏期名链球菌咽喉炎患者潜伏期正偏态正偏态分布分布讲义表讲义表2-4数据数据图图2-3 负偏态分布负偏态分布例例:某院出院患者住院天数的频数表某院出院患者住院天数的频数表组
11、段(天)组段(天)频数(频数(f)0-6 5-2110-1415-1320-625-230-335-140及以上及以上 13合计合计 79第二节第二节 集中趋势的描述集中趋势的描述平均数指标的概念和作用平均数指标的概念和作用概念:平均数表示一组同质计量数据概念:平均数表示一组同质计量数据集中趋势集中趋势的位置的位置和和平均水平平均水平。作用:是一组计量数据平均水平的代表值;可作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值作为不同组间的比较值。医学中常用的平均数指标有:医学中常用的平均数指标有:算数均数、几何均数、中位数算数均数、几何均数、中位数一、算术均数一、算术均数(mean)
12、简称均数,用 表示.公式适用频数公式适用频数为正态或近似为正态或近似正态分布的计正态分布的计量资料量资料.基本公式(基本公式(2-1,2-2)加权法公式(例数多)加权法公式(例数多)适用条件适用条件表表2-1 101名正常成年女性血清总胆固醇频数表名正常成年女性血清总胆固醇频数表 组段组段 频数(频数(f)组中值组中值X fX 2.3-1 2.45 2.3-1 2.45 2.452.45 2.6-3 2.75 8.25 2.6-3 2.75 8.25 2.9-6 3.05 18.30 2.9-6 3.05 18.30 3.2-8 3.35 3.2-8 3.35 3.5-17 3.65 3.5-
13、17 3.65 3.8-20 3.95 3.8-20 3.95 4.1-17 4.25 4.1-17 4.25 4.4-12 4.55 4.4-12 4.55 4.7-9 4.85 4.7-9 4.85 5.0-5 5.15 5.0-5 5.15 5.3-2 5.45 5.3-2 5.45 5.6-5.9 1 5.75 5.6-5.9 1 5.75 合计合计合计合计 101 409.7101 409.7加权法公式计算加权法公式计算频数(频数(f)作作为为X值的权数值的权数二、几何均数二、几何均数(Geometric mean)(Geometric mean)适用条件适用条件:X值呈倍数增长或部
14、分数据偏离值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料过大偏态分布(正偏态)资料。计算公式:计算公式:直接法,例数直接法,例数较少用(较少用(2-3)加权法,加权法,(2-4)或或 例例2-4 某某地地5例例微微丝丝蚴蚴血血症症患患者者治治疗疗7年年后后用用间间接接荧荧光光抗抗体体试试验验测测得得其其抗抗体体滴滴度度分分别别为为1/10,1/20,1/40,1/80,1/160,求几何均数,求几何均数。结论:平均抗体滴度为结论:平均抗体滴度为1:34(几何均数法)(几何均数法)表表2-5 69例例RA患者血清患者血清EBV-lgG抗体测定结果抗体测定结果滴度倒数滴度倒数滴度倒数滴度倒数
15、 X X 人数人数人数人数 f f lgXlgX flgXflgX10104 41.00001.00004.00004.000020203 31.30101.30103.90303.9030404010101.60211.602116.021016.0210808010101.90311.903119.031019.031016016011112.20412.204124.245124.245132032015152.50512.505137.576537.576564064014142.80622.806239.286839.28681280 1280 2 23.1072 3.1072 6.
16、21446.2144合计合计合计合计6969150.2778150.2778几何均数计算几何均数计算例例2-5:例数合计:例数合计 结论:结论:69例例RA患者血清患者血清EBV-lgG抗体平均滴抗体平均滴度为度为1:150.6三、中位数三、中位数和百分位数和百分位数(一)中位数(一)中位数(MedianMedian,M):适用于描述适用于描述偏态分布资料的平均水平偏态分布资料的平均水平。如潜伏期、病潜伏期、病程资料。程资料。计算定义:计算定义:将一组变量值由小到大依次排列,居以将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数中间位次的观察值即为中位数,为这组数据的平均数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 统计 描述 精品
限制150内