欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    02-医学统计学定量数据的统计描述.pptx

    • 资源ID:67206835       资源大小:401.08KB        全文页数:43页
    • 资源格式: PPTX        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    02-医学统计学定量数据的统计描述.pptx

    医学统计学医学统计学定量数据的统计描述定量数据的统计描述卫生部卫生部“十二五十二五”规划教材规划教材频数分布频数分布频数分布的目的频数分布的目的和用途和用途目的:了解数据的分布范围、集中位置以及分布形态等目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分布情况选择合适的统计方法。特征,以便根据资料分布情况选择合适的统计方法。用途:用途:作为陈述资料的形式;作为陈述资料的形式;便于观察数据的分布类型;便于观察数据的分布类型;便于发现数据中特大或特小的可疑值;便于发现数据中特大或特小的可疑值;当样本量大时,可用各组段的频率作为概率的估计当样本量大时,可用各组段的频率作为概率的估计值。值。频数表频数表(frequency frequency tabletable)的编制)的编制a、计算全距(、计算全距(range,R):是一组数据的最大值与最小值:是一组数据的最大值与最小值之差。之差。RMax-Minb、确定、确定组数组数与组距与组距 样本量在样本量在100例左右,例左右,组数组数选择选择815之间,一般取之间,一般取10组组左右。左右。组距组距全距全距/组数组数c、确定、确定组限组限 第一组段必须包括最小值,最后一组段必须包括最大值。第一组段必须包括最小值,最后一组段必须包括最大值。最后一组段包括最大值,且一般情况下应包含该组段上最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。限,其余各组段区间左闭右开。d、计算各组段频数(、计算各组段频数(frequency):即计算各组段内观察:即计算各组段内观察值的个数。值的个数。e、计算各组段频率(、计算各组段频率(percent):即计算各组段频数与总:即计算各组段频数与总观察值个数之比,用百分数表示。观察值个数之比,用百分数表示。f、计算累计频数(、计算累计频数(cumulative frequency)和累计频率()和累计频率(cumulative percent):累计频数是由上至下将频数累加;:累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。累计频率是由上至下将频率累加。频数表频数表(frequency frequency tabletable)的编制)的编制【例例】抽样调查某地抽样调查某地120名名1835岁健康男性居民血清铁含岁健康男性居民血清铁含量量(mol/L),试编制此血清铁资料的频数分布表。,试编制此血清铁资料的频数分布表。7.428.6523.0221.621.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52表表 120名健康男性居民血清铁含量频数分布表名健康男性居民血清铁含量频数分布表直方图直方图(histogramhistogram)直方图,是以垂直条段代表频数分布的一种图形。直方图,是以垂直条段代表频数分布的一种图形。频数,由频数,由纵轴标度纵轴标度组限,由横轴标度组限,由横轴标度组距,条段的宽度组距,条段的宽度直方图直方图(histogramhistogram)对称分布对称分布(symmetric distribution)偏态分布偏态分布(skewed distribution)右偏态分布右偏态分布(right-skewed distribution)左偏态分布左偏态分布(left-skewed distribution)图图 120名健康男性居民血清铁含量频数分布图名健康男性居民血清铁含量频数分布图【例例】抽样调查某地抽样调查某地120名名1835岁健康男性居民血清铁含岁健康男性居民血清铁含量量(mol/L),试编制此血清铁资料的频数分布表。,试编制此血清铁资料的频数分布表。集中趋势的统计指标集中趋势的统计指标 平均数(平均数(average),是描述一),是描述一组观察组观察值集中值集中位置位置或平均水平的统计指标,常作为一组数据的代表值用或平均水平的统计指标,常作为一组数据的代表值用于分析和进行组间的比较。于分析和进行组间的比较。常用常用的有算术均数、几何均数、的有算术均数、几何均数、中位数、百分位中位数、百分位数等数等。概概 述述算术均数算术均数 算术均数(算术均数(arithmetic mean),),等于一个变量所等于一个变量所有观察值的和除以观察值个数。有观察值的和除以观察值个数。总体均数用希腊字母总体均数用希腊字母表示,样本均数用符号表示,样本均数用符号 表示。表示。算术均数适用于对称分布的资料,如分布均匀的小算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据。样本数据或近似正态分布的大样本数据。算术均数易受极端值的影响,并且受极大值的影响算术均数易受极端值的影响,并且受极大值的影响大于受极小值的影响。大于受极小值的影响。1、直接法、直接法n为样本量,为样本量,X为个体观察值。为个体观察值。【例例】测得测得8只正常大鼠血清总酸性磷酸酶(只正常大鼠血清总酸性磷酸酶(TACP)含)含量量(U/L)为为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。试求其算术均数。算术均数算术均数2、加权法(频数、加权法(频数表表法)法)f为组段的频数,为组段的频数,n为总频数为总频数,X为组段的组中值。为组段的组中值。X=(组段上限组段上限+组段下限组段下限)/2算术均数算术均数【例例】120名健康男性居民血清铁含量的频数分布表,试名健康男性居民血清铁含量的频数分布表,试求其算术均数。求其算术均数。几何均数几何均数 几何均数(几何均数(geometric mean,G),等于一个变量),等于一个变量所有所有n个观察值的乘积的个观察值的乘积的n次方根。次方根。几何均数适用于取对数后近似呈对称分布的资料,几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常用于比例数据。尤其是右偏态分布数据。医学研究中常用于比例数据。【注注】计计算算几几何何均均数数的的观观察察值值不不能能小小于于或或等等于于0,因为无法求对数。因为无法求对数。几何均数几何均数1、直接法:、直接法:【例例】某医院测得某医院测得10个某种传染病人的白细胞计数个某种传染病人的白细胞计数(103),),测定值为:测定值为:11,9,35,5,9,8,3,10,12,8。计算。计算这这10个观察值的几何均数。个观察值的几何均数。几何均数几何均数2、加权法(频数、加权法(频数表表法)法)【例例】52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度数据表,试求其滴度数据表,试求其几何均数。几何均数。f为组段的频数,为组段的频数,X为组段的组中值,为组段的组中值,n为总频数。为总频数。中位数中位数 中位数(中位数(median,M),是在按大小顺序排列的变),是在按大小顺序排列的变量的所有观察值中,位于正中间的一个或两个数值。量的所有观察值中,位于正中间的一个或两个数值。中位数的确定取决于它在数据序列中的位置,因此中位数的确定取决于它在数据序列中的位置,因此对极端值不敏感。对极端值不敏感。当数据呈偏态分布、或频数分布两端无确定数值,当数据呈偏态分布、或频数分布两端无确定数值,均宜采用中位数描述集中趋势。均宜采用中位数描述集中趋势。中位数中位数n n为奇数时,为奇数时,M M X X(n+1)/2(n+1)/2 n n为偶数时,为偶数时,M M(X Xn/2n/2+X Xn/2+1n/2+1)/2)/21、直接法、直接法【例例】某药厂观察某药厂观察9只小鼠口服高山红景天醇提物只小鼠口服高山红景天醇提物(RSAE)后在乏氧条件下的生存时间)后在乏氧条件下的生存时间(分钟分钟)为:为:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试。试求其中位数。求其中位数。2、频数表计算法、频数表计算法L、iM、fM分别为分别为M所在组段的下限、组距和频数,所在组段的下限、组距和频数,n为总频数,为总频数,fL为所在组段之前各组段的累计频数。为所在组段之前各组段的累计频数。中位数中位数【例例】101名正常人血清肌红蛋白含量名正常人血清肌红蛋白含量(g/ml)的频数分的频数分布表。试求其中位数。布表。试求其中位数。M=X(101+1)/2=X51;根据累计频数,根据累计频数,X51位于组段位于组段35,40)按公式按公式,M=35+(0.510142)/23 5百分位数百分位数 百分位数(百分位数(percentile),是一个位置指标,它将),是一个位置指标,它将一组变量值排列后划分为若干相等部分的分割点数值。一组变量值排列后划分为若干相等部分的分割点数值。用用Px表示,表示,X用百分数表示。用百分数表示。表示在按照升序排列的数据中,其左侧(表示在按照升序排列的数据中,其左侧(Px)的)的观察值个数在整个样本中所占百分比为观察值个数在整个样本中所占百分比为X%,其右侧,其右侧(Px)的观察值个数在整个样本中所占百分比为)的观察值个数在整个样本中所占百分比为(100X)%。L、i、fx分别为所在组段的下限、组距和频数,分别为所在组段的下限、组距和频数,n为总频数,为总频数,fL为所在组段之前各组段的累计频数。为所在组段之前各组段的累计频数。【例例】101101名正常人血清肌红蛋白含量名正常人血清肌红蛋白含量(g/ml)(g/ml)的频数分布的频数分布表。试求其百分位数表。试求其百分位数 P P25%25%、P P50%50%、P P75%75%。百分位数百分位数百分位数百分位数 百百分分位位数数不不论论资资料料分分布布类类型型均均可可计计算算,在在实实际际工工作作中中常常用用于于确确定定医医学学参参考考值值范范围围;在在假假设设检检验验中中用用作作拒拒绝或不拒绝检验假设的界值。绝或不拒绝检验假设的界值。百分位数并非由全部观察值综合计算得来,因此,百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差精确;然而中间部分的百分位数它不如均数和标准差精确;然而中间部分的百分位数因不受资料中个别极端数据的影响,具有较好的稳定因不受资料中个别极端数据的影响,具有较好的稳定性。性。小小 结结指指 标标意意 义义适用场合适用场合均均 数数个体的平均值个体的平均值对称分布,特别是正态分布资料。对称分布,特别是正态分布资料。几何均数几何均数平均倍数平均倍数取对数后对称分布。取对数后对称分布。中位数中位数位次居中的观察值位次居中的观察值非对称分布;非对称分布;半定量资料;半定量资料;末端无确切数值;末端无确切数值;分布不明。分布不明。变异程度的统计指标变异程度的统计指标 变异指标又称离散指标,用以描述一组计量资料各变异指标又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。观察值之间参差不齐的程度。变异指标越大,观察值之间差异愈大,说明变异程变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。度越大;反之亦然。常用的有极差、四分位数间距、方差、标准差和变常用的有极差、四分位数间距、方差、标准差和变异系数。异系数。概概 述述极极 差差 极差(极差(range,R),等于一个变量所有观察值中最),等于一个变量所有观察值中最大值与最小值之间的差值。大值与最小值之间的差值。R Max Min【例例】A组:组:26,28,30,32,34;B组:组:24,27,30,33,36;C组:组:26,29,30,31,34。试用极差说明。试用极差说明三组数据的离散状况。三组数据的离散状况。极极 差差 缺点:缺点:没有利用观察值的全部信息,不能反映其它数据没有利用观察值的全部信息,不能反映其它数据的离散度;的离散度;各样本含量大小悬殊时,不宜比较其极差;各样本含量大小悬殊时,不宜比较其极差;极差的抽样误差也较大,所以不够稳定。极差的抽样误差也较大,所以不够稳定。极差仅适用于对未知分布的小样本资料作粗略的分析。极差仅适用于对未知分布的小样本资料作粗略的分析。四分位数间距四分位数间距 四分位数,是统计学对特殊的三个百分位数四分位数,是统计学对特殊的三个百分位数P P25%25%、P P50%50%和和 P P75%75%的统称。的统称。四分位数间距(四分位数间距(quartile rangequartile range,Q Q),),等于第三四分等于第三四分位数与第一四分位数之间的差值。位数与第一四分位数之间的差值。Q P75%P25%分割点1 分割点2 分割点3四分位值1(Q1)四分位值2(Q2)四分位值3(Q3)四分位数间距四分位数间距【例例】101名正常人血清肌红蛋白含量名正常人血清肌红蛋白含量(g/ml)的频数分的频数分布表。试求其四分位数间距。布表。试求其四分位数间距。缺点:缺点:没有利用观察值的全部信息,不能反映其它数据没有利用观察值的全部信息,不能反映其它数据的离散度;的离散度;四分位数间距仅用来描述大样本偏态资料的变异情况。四分位数间距仅用来描述大样本偏态资料的变异情况。四分位数间距四分位数间距方方 差差 方差(方差(variancevariance),),是描述一个变量的所有观察值与是描述一个变量的所有观察值与总体均数的平均离散程度的指标。总体均数的平均离散程度的指标。总体方差用总体方差用2表示,样本方差用表示,样本方差用 S2表示。表示。方方 差差1、直接法:、直接法:2、频数表法、频数表法f为组段的频数,为组段的频数,X为组段的组中值。为组段的组中值。标准差标准差 标准差(标准差(standard deviationstandard deviation,S S),),是描述一个变量是描述一个变量的所有观察值与均数的平均离散程度的指标。的所有观察值与均数的平均离散程度的指标。总体标准差用总体标准差用表示,样本标准差用表示,样本标准差用 S表示。表示。标准差标准差1、直接法:、直接法:2、频数表法、频数表法f为组段的频数,为组段的频数,X为组段的组中值。为组段的组中值。C组的标准差最小,组的标准差最小,B组的最大。意味着组的最大。意味着C组数据的离组数据的离散趋势最小,散趋势最小,B组的最大组的最大 。A组组B组组C组组【例例】A组:组:26,28,30,32,34;B组:组:24,27,30,33,36;C组:组:26,29,30,31,34。试用标准差说。试用标准差说明三组数据的离散状况。明三组数据的离散状况。【例例】101名正常人血清肌红蛋白含量名正常人血清肌红蛋白含量(g/ml)的频数分的频数分布表。试求其四分位数间距。布表。试求其四分位数间距。标准差标准差 方差或标准差属同类变异指标,它们多用来描述均方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用在许多医学研究报告中常用 的形式表达资料。的形式表达资料。变异系数变异系数 变异系数(变异系数(coefficient of variationcoefficient of variation,CV CV),),是一个是一个度量相对离散程度的指标。度量相对离散程度的指标。CV是无量纲的指标,可以用来比较几个量纲不同的是无量纲的指标,可以用来比较几个量纲不同的指标变量之间的离散程度的差异,或比较量纲相同但均指标变量之间的离散程度的差异,或比较量纲相同但均数相差悬殊的变量之间的离散程度的差异。数相差悬殊的变量之间的离散程度的差异。【例例】根据体格检查,根据体格检查,15名大学生的体重(名大学生的体重(kg)和身高)和身高(cm)的数据)的数据。体重:。体重:6565,6262,5050,7878,6565,4545,5151,7474,6060,8888,5050,7474,6666,7070;身高:;身高:171171,169169,157157,183183,160160,155155,165165,174174,166166,170170,186186,154154,160160,159159,161161。比较这。比较这1515名大学生体重和身高的变异程度。名大学生体重和身高的变异程度。=64.0 =64.0,S S(W)(W)=11.83=11.83,CV CV(W)(W)=(11.83/64.0)100%=18.49%=(11.83/64.0)100%=18.49%;=166.0 =166.0,S S(H)(H)=9.62=9.62,CV CV(H)(H)=(9.62/166.0)100%=5.80%=(9.62/166.0)100%=5.80%15 15名大学生体重的变异大于身高的变异。名大学生体重的变异大于身高的变异。小小 结结指指 标标意意 义义适用场合适用场合极极 差差观察值的取值范围观察值的取值范围不拘分布形式,概略分析。不拘分布形式,概略分析。四分位数四分位数间距间距居中半数观察值的极差居中半数观察值的极差非对称分布;非对称分布;半定量资料;半定量资料;末端无确切数值;末端无确切数值;分布不明。分布不明。标准差标准差(方差)(方差)观察值距离均数的平均程度观察值距离均数的平均程度对称分布,特别是正态分布资料。对称分布,特别是正态分布资料。变异系数变异系数变异程度大小的对比变异程度大小的对比不同量纲的变量间比较;不同量纲的变量间比较;量纲相同但数量级相差悬殊的变量纲相同但数量级相差悬殊的变量间比较。量间比较。

    注意事项

    本文(02-医学统计学定量数据的统计描述.pptx)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开