欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    定量资料的统计描述讲义.pptx

    • 资源ID:16400196       资源大小:186.17KB        全文页数:30页
    • 资源格式: PPTX        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    定量资料的统计描述讲义.pptx

    定量资料的统计描述定量资料的统计描述 统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.第一节第一节 频数分布表与频数分布图频数分布表与频数分布图频数分布表频数分布表用于反映各变量(观察单位的某种特征)值及其相应频数之间关系的一类表格,我们称之为频数表.这里频数指对一种变量在多个观察单位中进行多次观察,其中某一变量值重复出现的次数.不同的资料类型编制频数表难易程度不同,其中计数资料和等级资料比较简单,而计量资料相对较繁杂些. 计量资料频数表的编制计量资料频数表的编制 一般情况下,样本含量小于30的统计资料无须编制频数表,但对于大样本含量的资料,编制频数表有利于进一步的统计分析、且频数表本身也具有统计描述的作用. 求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数选 极差即最大值与最小值之差 一般 815 之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,最后一组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。 根据变量值大小把各观察单位归入各个组段 编制频数表的步骤编制频数表的步骤编制频数表步骤流程图编制频数表步骤流程图举例说明计量资料频数表的编制过程举例说明计量资料频数表的编制过程 某地 13 岁女孩 118 人的身高(cm)资料 151.3 134.1 143.7 144.9 152.2 145.0 146.4 141.2 143.3 156.3 142.0 141.3 142.5 145.5 149.5 141.1 150.6 140.9 147.2 144.8 144.5 139.8 145.7 139.3 144.8 147.5 140.5 139.9 135.4 148.5 139.1 144.5 138.5 146.2 146.8 142.3 150.9 145.5 138.1 147.1 143.8 140.5 138.5 145.2 146.8 148.9 151.8 145.6 138.1 148.1 143.9 141.5 160.8* 155.2 138.9 140.9 150.7 148.6 137.9 148.1 135.4 147.8 139.9 148.7 139.5 140.6 144.5 142.9 129.4* 143.5 142.1 149.8 154.6 148.7 153.2 146.5 132.5 146.8 148.6 145.0 136.5 145.0 144.6 137.5 143.5 150.0 143.5 146.5 149.8 143.1 143.3 157.6 143.7 146.7 139.2 142.6 143.5 131.5 135.5 149.8 135.4 149.8 138.9 152.3 141.8 150.8 146.3 142.5 147.5 136.1 141.2 146.4 143.8 149.5 147.5 140.3 138.5 142.5 步骤如下:步骤如下:n R=160.8-129.4=31.4。n 组段数=10;组距=R/10=3.1430(cm);按要求确定每一组段上下限。n 分组统计每一组段的频数,编制频数表。 118 例 13 岁女孩身高(cm)资料频数表。 身高组段 频数 组中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合计 118 计量资料频数分布表计量资料频数分布表 计量资料频数分布图计量资料频数分布图 身高160.0158.0156.0154.0152.0150.0148.0146.0144.0142.0140.0138.0136.0134.0132.0130.020100Std. Dev = 5.46 Mean = 144.3N = 118.00频数分布表的用途频数分布表的用途Z揭示数值变量频数分布的类型和特征 Z作为陈述资料的形式Z便于发现一些特大或特小的可疑值Z便于进一步的统计分析 分布特征分布特征 集中趋势:集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势 离散趋势:离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都有频数分布,而不是所有频数分布在集中位置的趋势。 分布类型分布类型 对称分布:对称分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少 计量资料频数分布的类型和特征计量资料频数分布的类型和特征 第二节 集中趋势的描述指标 1、算术平均数(arithmetic mean) (1) 直接法 nxxxnxXnnii 211 (2)加权法 又称频数表法,适用于频数表资料。当观察例数较时用。 kkkkiiikiifffxfxfxffxfX 21221111 2、几何平均数(geometric mean) 几何平均数用符号 G 表示。用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。 医学上常用于表示类似抗体滴度等呈倍数关系的等比级数资料。 1)直接法 nxnxxxxxxGniinnn1121121lglglglglglg 例 有 6 份血清的抗体效价分别为 1:10,1:20,1:40,1:80,1:160,1:320,求平均抗体效价。 为便于计算,可先将抗体效价取倒数,将效价倒数代入公式 ,得 G=(lg10+lg20+lg40+lg80+lg160+lg320)/6= (1.7526)=56.57 6 份血清的平均抗体效价为 1:56.57 (2)加权法 又称频数表法,当观察例数 n 较大时,可先编制频数分布表,用此法计算几何平均数 kiikiiifxfG111lglg 例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏和第(2)栏,求平均抗体滴度。 表 100 名受试者平均抗体滴度计算表 抗体滴度 频数f 滴度倒数 X lgX flgX (1) (2) (3) (4) (5)=(2)(4) 1:4 6 4 0.6021 3.6126 1:8 10 8 0.9031 9.0310 1:16 16 16 1.2041 19.2656 1:32 34 32 1.5051 51.1734 1:64 20 64 1.8062 36.1240 1:128 8 128 2.1072 16.8576 1:256 5 256 2.4082 12.0410 1:512 1 512 2.7093 2.7093 合计 100 - - 150.8145 k1iik1iii1fxlgflgG=(150.8145/100) =(1.5081)=32.2 100 名受试者平均抗体滴度为 1:32.2。 3、百分位数(percentile)与中位数(median) 百分位数是一种位置指标,用符号Px表示常用的百分位数有P2.5,P5,P25,P50,P75,P95,P97.5等,其中P25,P50,P75又称为四分位数。百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。 中位数是一个特定的百分位数即P50,用符号M表示。把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。中位数理论上可用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。其计算方法有直接法和频数表法两种。 (1)直接法 当观察例数 n 不大时, 此法常用。先将观察值按大小顺序排列,选用下列公式求 M。 当 n 为奇数时 M=X(n+1)/2 当 n 为偶数时 M=2122nnXX 例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8,10,18,求它们的中位数。 本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算得 M=2XX12n2n = X4 + X5/2=(4+7)/2=5.5(天) (2)频数表法 当观察例数n较多时,可先编制频数表,再通过频数表计算中位数。 公式为: M = Lm + i/fm( n50% - fL ) 例 现有187例某种沙门氏菌食物中毒病人的潜伏期(小时),见表第(1)栏、第(2)栏,求中位数。 表 187 例某种沙门氏菌食物中毒潜伏期(小时)分布 潜伏期(小时) 频数 f 累计频数f (1) (2) (3) 0- 35 35 12- 70 105 24- 40 145 36- 23 168 48- 12 180 60- 6 186 72-84 1 187 M = 12 + 12/70( 18750% - 35 )= 22.0(小时) 中位数M即第50百分位数P50,故百分位数Px的计算类似M,计算公式为: Px = Lx + i/fx( nx% - fL ) 例 求上表资料的P2.5,P25,P75。 本例n=187,因1872.5%=4.675,18725%=46.75,18775%=140.25, 结合表第(3)栏累计频数可知P2.5,P25,P75分别在“0-”,“12-”,“24-”组段内, P2.5 = 0 + 12/35( 1872.5% - 0 )=1.6(小时) P25 = 12 + 12/70( 18725% - 35 )=14.0(小时) P75 = 24 + 12/40( 18775% - 105 )=34.6(小时)第三节 离散趋势的描述指标 1、全距(range) 计算公式为: R = XmaxXmin 全距越大,说明变量的变异程度越大。其度量单位与原变量单位相同。2、四分位数间距(quartile) 是一组数值变量值中上四分数(即P75,记为Qu)与下四分数(即P25,记为QL)之差,用符号QR表示 计算公式为: QR =P75-P25 它一般和中位数一起描述偏态分布资料的分布特征。3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用符号2(读seigama)表示,样本方差用S2表示。计算公式分别为:NxNii1221122nXxSnii 4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用表示,样本标准差用S表示。计算公式分别为: NxN1i2i 11121212nnxxnXxSniniiinii

    注意事项

    本文(定量资料的统计描述讲义.pptx)为本站会员(修****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开