欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    医学统计学之集中趋势的统计描述.ppt

    • 资源ID:67233533       资源大小:665KB        全文页数:49页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    医学统计学之集中趋势的统计描述.ppt

    集中趋势的统计描述Measures of CentralMeasures of Central TendencyTendencyMedical statistics医学统计学赵华硕赵华硕Outline频数表和频数图频数表和频数图的信息数值变量资料的统计描述数值变量资料的统计描述描述集中位置的指标描述离散趋势的指标正确应用分类变量资料的统计描述分类变量资料的统计描述总结例1:乱七八糟的原始数据某地140名成年男子红细胞计数(1012个/升)资料如下4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.885.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.505.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.984.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46 4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.074.81 4.54 3.82 4.01 4.89 4.62 5.12 4.85 4.59 5.08 4.82 4.935.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.794.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.654.76 4.88 4.61 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.504.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36 4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.224.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76频数分布表和频数分布图原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。现状:医学研究得到的原始数据(raw data)往往是庞大的、混乱的。解决:频数分布表的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。频数分布表的制作步骤频数分布表的制作步骤计算极差(R)R=max-min=5.95-3.82=2.13(1012个/升)组数:815组距:i=R/组数=2.13/10=0.213 0.2(1012个/升)组段:含义:含下限不含上限。第一组段下限 min 最后一组上限max划记:计算频数 100名成年男子红细胞计数频数表组 段(1)频 数(2)频 率()(3)3.821.44.064.34.2117.94.42517.94.63222.94.82719.35.01712.15.2139.35.442.95.621.45.8 6.010.7合 计140100.00100名成年男子红细胞计数频数图图1 140名成年男性的血红细胞计数的频数分布 频数分布所提供的信息频数分布所提供的信息频数分布图用以表示数据的分布规律。观察有无可疑值。考察分布的类型。对称分布非对称分布(偏态分布)考察分布的特征 集中位置(Central Tendency)离散趋势(Tendency of Dispersion)289只近视眼Lasik术后1月裸眼视力Frequencynv0.000.100.200.300.400.500.600.700.800.901.001.10 1.200.0071.00偏态,正偏态和负偏态偏态,正偏态和负偏态分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。正偏分布是指分布的长尾在峰的右侧,又称右偏分布负偏分布是指分布的长尾在峰的左侧,又称左偏分布。常见偏态分布120名7岁男童身高的频数分布图124132140148156164010203040人数身高(cm)239人发汞含量的频数分布70 3 5 7 9 11 13 15 17 19 21 10 20 30 40 50 60 0 1 发汞含量(mol/kg)人数某市892名老年人生存质量自评分频数分布 0 10 20 30 40 50 60 70 80 90 100 100 200 300 0 400 自评分人数 102名黑色素瘤患者的生存时间频数分布 0 5 10 15 20 25 30 35 40 45 0 1 02 03 040 生存时间(月)人数某地某年10000例死亡者年龄分布 0102030405060708001000200030004000死亡年龄(岁)人数偏态分布1:老年人生存质量自评分0 10 20 30 40 50 60 70 80 90 100 100 200 300 0 400 自评分人数偏态分布2:黑色素瘤患者的生存时间0 5 10 15 20 25 30 35 40 45 0 1 02 03 040 生存时间(月)人数集中位置和离散趋势集中位置和离散趋势124132140148156164010203040人数身高(cm)2.2 2.2 描述集中位置的指标描述集中位置的指标平均数平均数(Average)(Average)算术均数算术均数(Mean)(Mean)几何均数几何均数(Geometric Mean)(Geometric Mean)中位数中位数(Median)(Median)百分位数百分位数(Percentile)(Percentile)描述集中位置的指标:算术均数描述集中位置的指标:算术均数算术均数(arithmetic mean,mean,)定义:使用条件 单峰对称分布、正态分布的资料单峰对称分布、正态分布的资料加权均数(weighted mean)加权法计算实例(例2.1)组 段(1)频 数(2)组中值(3)频 率()(4)3.823.97.84.064.124.64.2114.347.34.4254.5112.54.6324.7150.44.8274.9132.35.0175.186.75.2135.368.95.445.522.05.625.711.45.8 6.015.95.9合 计140669.8100名成年男性血红细胞均数计算表名成年男性血红细胞均数计算表描述集中位置的指标:几何均数描述集中位置的指标:几何均数几何均数(geometric mean,G)定义使用条件 呈倍数关系变化或对数正态分布常用几何均数计算实例几何均数计算实例1:10,1:20,1:40,1:80,1:160描述集中位置的指标:中位数描述集中位置的指标:中位数中位数(median,M)定义:将一组数据按从小到大的顺序排列,位置居中的数即是中位数。使用条件:偏态分布资料、开口资料、分布不明计算中位数计算实例中位数计算实例9例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.810例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2 中位数例对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人,6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。描述集中位置的指标:百分位数描述集中位置的指标:百分位数百分位数(percentile)X%PX (100-X)%50%分位数就是中位数25%,75%分位数称四分位数(quartile)某地630名正常女性血清甘油三酯含量(ug/dl)甘油三酯 频数 累积频数 累积频率 10 27 27 4.3 40 169 196 31.1 70 167 363 57.6100 94 457 72.5130 81 538 85.4160 42 580 92.1190 28 608 96.5220 14 622 98.7250 4 626 99.4280 3 629 99.8310 1 630 100.0合计 630 -13016081M?平均数应用的注意事项平均数应用的注意事项同质的资料计算平均数才有意义根据资料分布的特征选用适当的平均数均数:单峰对称分布的资料几何均数:等比资料、滴度资料、正偏态资料中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。(偏态分布、分布不明资料、有 不确定值的资料)平均数应用的注意事项计算几何均数时:变量值中不能有0 同一组变量值不能同时存在正、负值 若变量值全为负值,可先将负号除去,算出结果后再冠以负号 样本含量较少时不宜计算靠近两端的百分位数 平均数要与变异指标结合使用例:只用平均数描述资料的弊病甲组 26 29 30 31 34 均数30kg乙组 24 27 30 33 36 均数30kg丙组 26 28 30 32 34 均数30kg丙乙甲三组儿童体重的离散程度三组儿童体重的离散程度描述离散趋势的指标描述离散趋势的指标变异度极差(Range)四分位数间距(interquartile range)方差(Variance)标准差(Standard Deviation)变异系数(coefficient of variation)描述离散趋势的指标:极差全距(range),极差 R=maxmin意义:?优点:简单明了缺点:不灵敏:只考虑了最大、最小值 不稳定不稳定:抽样误差大描述离散趋势的指标:四分位数间距四分位数间距(inter-quartile range)QU QL P75 P 25适用于偏态分布的资料离散程度指标描述适用于偏态分布的资料离散程度指标描述偏态分布的资料的集中趋势偏态分布的资料的集中趋势?离均差离均差离均差之和离均差之和?离均差平方和离均差平方和离均差平方和与观察值的个数即样本含量(离均差平方和与观察值的个数即样本含量(n)有关有关描述离散趋势的指标:方差方差(variance)方差缺点方差缺点?描述离散趋势的指标:标准差标准差(standard deviation,sd)n-1:自由度(degree of freedom)甲组 26 29 30 31 34 乙组 24 27 30 33 36 丙组 26 28 30 32 34 极差 方差 标准差甲组 8 8.50 2.92乙组 12 22.504.74丙组 8 10.003.16标准差是描述变量值变异程度的指标。标准差是描述变量值变异程度的指标。标准差大标准差大 变异程度大变异程度大 均数的代表性差均数的代表性差标准差小标准差小 变异程度小变异程度小 均数的代表性好均数的代表性好用途用途1 1 表示变异程度的大小表示变异程度的大小2 2 计算标准误、变异系数计算标准误、变异系数3 3 估计正常值范围估计正常值范围标准差的意义标准差的意义描述离散趋势的指标:变异系数变异系数(coefficient of variation,CV)排除了平均水平的影响,并取消了单位。因此变异系数常用于:比较度量衡单位不同的两组或多组资料的变异度比较均数相差悬殊的两组或多组资料的变异度。不同指标间变异度的比较例例2.7某地年龄儿童身高(cm)的变异年龄组年龄组人数人数均数均数标准差标准差变异系变异系数数()12月月10056.32.13.756月月12066.52.23.3 33.5岁岁30096.13.13.2 55.5岁岁400107.83.33.1正确应用(1)算数均数:适用于单峰对称分布资料;几何均数:适合于作对数变换后单峰对称分布资料;中位数和百分位数:适用于任何分布的资料;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。正确应用(2)极差不稳定,不灵敏标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。总结:每个观察指标均有其特定的变异规律;描述变异:图形描述统计量描述平均数:均数、几何均数、中位数变异度:标准差、四分位数间距、变异系数、极差不同分布的指标,用不同的统计量描述;用平均数与变异度共同描述。Thank U

    注意事项

    本文(医学统计学之集中趋势的统计描述.ppt)为本站会员(赵**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开