欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数值变量资料的统计描述.ppt

    • 资源ID:64355703       资源大小:1.03MB        全文页数:112页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数值变量资料的统计描述.ppt

    第八章第八章 数值变量资料的统计描述数值变量资料的统计描述2022/11/292022/11/291 1回顾回顾:根据是否定量划分根据是否定量划分根据是否定量划分根据是否定量划分,资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型:n n数值资料数值资料数值资料数值资料(measurement data):(measurement data):(measurement data):(measurement data):用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料,亦称作亦称作亦称作亦称作计量资料计量资料计量资料计量资料。n n分类变量资料分类变量资料分类变量资料分类变量资料(enumeration data):(enumeration data):(enumeration data):(enumeration data):用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料,亦称亦称亦称亦称计数资料。计数资料。计数资料。计数资料。n n等级资料等级资料等级资料等级资料(ranked data):(ranked data):(ranked data):(ranked data):不能精确测量不能精确测量不能精确测量不能精确测量,仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。2022/11/292022/11/292 2第一节 数值变量资料频数分布 数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。数分布表或分布图了解资料的分布特征。数分布表或分布图了解资料的分布特征。数分布表或分布图了解资料的分布特征。一、频数分布表及其制作一、频数分布表及其制作 2022/11/292022/11/293 3例例8.1 8.1 某地区某地区20022002年年55555858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测定值如下,试编制频数表和观察频数分布情况。测定值如下,试编制频数表和观察频数分布情况。5.175.175.565.564.864.864.874.874.744.745.245.245.515.514.464.464.964.964.824.824.904.905.305.305.225.225.585.584.484.484.804.804.64.64.024.025.165.165.365.364.344.344.244.244.644.644.274.274.254.254.444.444.464.464.624.624.874.874.344.344.904.905.255.254.774.774.854.855.075.074.164.164.664.664.704.704.204.203.953.954.094.094.644.644.334.335.215.214.614.614.984.985.245.244.604.604.254.254.784.785.005.003.603.603.603.604.114.114.614.614.084.084.784.784.264.264.444.444.384.384.44.44.794.794.764.764.924.924.604.604.784.785.035.034.354.354.184.184.684.684.654.654.574.574.274.274.994.994.214.214.894.894.714.714.724.724.414.414.384.384.064.064.794.794.964.964.834.834.454.454.514.514.274.274.504.504.314.315.055.055.595.595.595.595.085.085.165.163.743.744.364.365.365.364.644.645.095.094.574.574.464.464.564.564.394.395.245.244.614.614.214.214.964.964.344.344.454.454.864.864.504.504.904.904.454.454.494.494.424.424.684.684.564.565.385.384.344.344.464.464.164.164.984.984.294.294.834.834.274.273.683.683.853.853.863.864.564.564.564.564.554.555.165.165.155.155.165.162022/11/292022/11/294 4编制频数分布表的步骤编制频数分布表的步骤计计算算极极差差编制频数分编制频数分布表的步骤布表的步骤确确定定组组数数组组距距计计算算频频数数编编制制表表格格2022/11/292022/11/295 5频数表的编制步骤频数表的编制步骤:(1 1)求极差求极差(rangerange):即最大值与最小值之差,又称):即最大值与最小值之差,又称为全距。为全距。R R5.593.60=1.99(mol/L)5.593.60=1.99(mol/L)(2 2)决定组数、组段和组距:决定组数、组段和组距:根据研究目的和样本含量根据研究目的和样本含量n n确定分组组数。相邻两组段下限值之差称组距,组距确定分组组数。相邻两组段下限值之差称组距,组距=极极差差/组数,为方便计,组距为极差的十分之一组数,为方便计,组距为极差的十分之一,再略加调再略加调整。整。1.99/10 =0.199 0.2(mol/L)1.99/10 =0.199 0.2(mol/L)(3 3)列出组段列出组段:第一组段的下限必须包含最小值,最:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。后一个组段上限必须大于或等于最大值。3.63.6 3.8 3.8 5.2 5.2 5.4 5.4 5.6 5.6(4 4)划记计数划记计数:用划记法将所有数据归纳到各组段,:用划记法将所有数据归纳到各组段,得到各组段的频数。得到各组段的频数。2022/11/292022/11/296 62022/11/292022/11/297 7表8-1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132132100.00 100.00 2022/11/292022/11/298 8血糖血糖(mol/L)人人数数图图图图8-18-18-18-1某地区某地区某地区某地区2002200220022002年年年年55555555 58585858岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)(mmol/L)(mmol/L)测定值的频数分布图测定值的频数分布图测定值的频数分布图测定值的频数分布图二、频数分布图二、频数分布图2022/11/292022/11/299 9 同一组资料,不同的人编制的同一组资料,不同的人编制的频数表,结果不尽相同,允许几个频数表,结果不尽相同,允许几个合理的结果并存。合理的结果并存。2022/11/292022/11/291010三、频数表和频数分布图用途三、频数表和频数分布图用途1 1描述频数分布的类型描述频数分布的类型描述频数分布的类型描述频数分布的类型(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)2 2描述频数分布的特征描述频数分布的特征描述频数分布的特征描述频数分布的特征(集中趋势集中趋势集中趋势集中趋势 离散趋势)离散趋势)离散趋势)离散趋势)3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值4 4便于便于便于便于进一步做统计分析进一步做统计分析进一步做统计分析进一步做统计分析和处理(加权)和处理(加权)和处理(加权)和处理(加权)2022/11/292022/11/291111(1 1 1 1)对称分布)对称分布)对称分布)对称分布 :若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布1描述频数分布的类型(对称分布、偏态分布)描述频数分布的类型(对称分布、偏态分布)2022/11/292022/11/291212(2)偏态分布)偏态分布:n n1 1)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。n n2 2)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布):左侧的组段左侧的组段左侧的组段左侧的组段数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。2022/11/292022/11/291313正偏态(右偏态)正偏态(右偏态)负偏态(左偏态)负偏态(左偏态)返回2022/11/292022/11/291414频数分布的类型频数分布的类型对称分布对称分布对称分布正偏态分布正偏态分布正偏态分布负偏态分布负偏态分布负偏态分布2022/11/292022/11/2915152 2描述频数分布的特征描述频数分布的特征图图图图8-18-1(P P154154)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:数据数据数据数据变异(离散)变异(离散)变异(离散)变异(离散)的范围在的范围在的范围在的范围在3.605.60(mol/L3.605.60(mol/L)数据数据数据数据集中(平均)集中(平均)集中(平均)集中(平均)的组段的组段的组段的组段在在在在4.205.00(mol/L4.205.00(mol/L)之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数4.604.804.604.80(mol/L(mol/L)最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频数分布基本对称。数分布基本对称。数分布基本对称。数分布基本对称。返回2022/11/292022/11/2916163便于发现一些特大或特小的可疑值返回2022/11/292022/11/291717第二节 集中趋势指标n n统计上使用统计上使用统计上使用统计上使用平均数(平均数(平均数(平均数(averageaverageaverageaverage)这一指标体系来描这一指标体系来描这一指标体系来描这一指标体系来描述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。n n常用的平均数有常用的平均数有常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(算术均数(均数)(算术均数(均数)(meanmeanmeanmean)几何均数(几何均数(几何均数(几何均数(geometric meangeometric meangeometric meangeometric mean)中位数中位数中位数中位数 (medianmedianmedianmedian)百分位数(百分位数(百分位数(百分位数(percentilepercentilepercentilepercentile)2022/11/292022/11/291818一、算术均数算术均数:简称均数(算术均数:简称均数(meanmean)n n定定义义:是是一一组组变变量量值值之之和和除除以以变变量量值值个个数数所所得得的的商商。均均数数适适用用于于资资料料呈呈正正态态分分布布(或近似正态或对称分布)资料(或近似正态或对称分布)资料。n n总体均数总体均数:样本均数样本均数:x2022/11/292022/11/2919191、计算方法(1 1)直接计算法)直接计算法)直接计算法)直接计算法 公式公式:例例例例8.28.28.28.2有有有有9 9 9 9名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值(mol/L)(mol/L)(mol/L)(mol/L)为为为为:5.61:5.61:5.61:5.61,3.963.963.963.96,3.673.673.673.67,4.994.994.994.99,4.244.244.244.24,5.065.065.065.06,5.205.205.205.20,4.794.794.794.79,5.935.935.935.93求算术平均数。求算术平均数。求算术平均数。求算术平均数。x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9 =4.83(mol/L)=4.83(mol/L)2022/11/292022/11/292020例例8.1 8.1 某地区某地区20022002年年5555 5858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测测定值如下,试编制频数表和观察频数分布情况。定值如下,试编制频数表和观察频数分布情况。5.175.175.175.175.565.565.565.564.864.864.864.864.874.874.874.874.744.744.744.745.245.245.245.245.515.515.515.514.464.464.464.464.964.964.964.964.824.824.824.824.904.904.904.905.305.305.305.305.225.225.225.225.585.585.585.584.484.484.484.484.804.804.804.804.64.64.64.64.024.024.024.025.165.165.165.165.365.365.365.364.344.344.344.344.244.244.244.244.644.644.644.644.274.274.274.274.254.254.254.254.444.444.444.444.464.464.464.464.624.624.624.624.874.874.874.874.344.344.344.344.904.904.904.905.255.255.255.254.774.774.774.774.854.854.854.855.075.075.075.074.164.164.164.164.664.664.664.664.704.704.704.704.24.24.24.23.953.953.953.954.094.094.094.094.644.644.644.644.334.334.334.335.215.215.215.214.614.614.614.614.984.984.984.985.245.245.245.244.604.604.604.604.254.254.254.254.784.784.784.785.005.005.005.003.603.603.603.604.114.114.114.114.614.614.614.614.084.084.084.084.784.784.784.784.264.264.264.264.444.444.444.444.384.384.384.384.44.44.44.44.794.794.794.794.764.764.764.764.924.924.924.924.604.604.604.604.784.784.784.785.035.035.035.034.354.354.354.354.184.184.184.184.684.684.684.684.654.654.654.654.574.574.574.574.274.274.274.274.994.994.994.994.214.214.214.214.894.894.894.894.714.714.714.714.724.724.724.724.414.414.414.414.384.384.384.384.064.064.064.064.794.794.794.794.964.964.964.964.834.834.834.834.454.454.454.454.514.514.514.514.274.274.274.274.504.504.504.504.314.314.314.315.055.055.055.055.595.595.595.595.085.085.085.085.165.165.165.163.743.743.743.744.364.364.364.365.365.365.365.364.644.644.644.645.095.095.095.094.574.574.574.574.464.464.464.464.564.564.564.564.394.394.394.395.245.245.245.244.614.614.614.614.214.214.214.214.964.964.964.964.344.344.344.344.454.454.454.454.864.864.864.864.504.504.504.504.904.904.904.904.454.454.454.454.494.494.494.494.424.424.424.424.684.684.684.684.564.564.564.565.385.385.385.384.344.344.344.344.464.464.464.464.164.164.164.164.984.984.984.984.294.294.294.294.834.834.834.834.274.274.274.273.683.683.683.683.853.853.853.853.863.863.863.864.564.564.564.564.564.564.564.564.554.554.554.555.165.165.165.165.155.155.155.155.165.165.165.16x=(5.17+5.56+5.15+5.16)/132=4.648(mol/L)x=(5.17+5.56+5.15+5.16)/132=4.648(mol/L)2022/11/292022/11/292121(2)加权法(利用频数表)公式公式公式公式:k:频数表的组段数:频数表的组段数 f:频数:频数 :组中值,其中:组中值,其中i=1,2,k。2022/11/292022/11/292222表表8-1 某地区某地区2002年年5558岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)测定值的频数分布表测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段频数频数()()组中值组中值()3.603.603 3 3.70 3.70 11.10 11.10 41.07 41.07 3.803.803 3 3.90 3.90 11.70 11.70 45.63 45.63 4.004.008 8 4.10 4.10 32.80 32.80 134.48 134.48 4.204.2023 23 4.30 4.30 98.90 98.90 425.27 425.27 4.404.4024 24 4.50 4.50 108.00 108.00 486.00 486.00 4.604.6025 25 4.70 4.70 117.50 117.50 552.25 552.25 4.804.8020 20 4.90 4.90 98.00 98.00 480.20 480.20 5.005.0012 12 5.10 5.10 61.20 61.20 312.12 312.12 5.205.2010 10 5.30 5.30 53.00 53.00 280.90 280.90 5.405.405.605.604 4 5.50 5.50 22.00 22.00 121.00 121.00 合计合计132132614.20614.202878.922878.92 x=614.2/132=4.653(mol/L)x=614.2/132=4.653(mol/L)2022/11/292022/11/292323二、几何均数(geometric mean)n n定义:用定义:用定义:用定义:用G G表示,是将表示,是将表示,是将表示,是将n n个观察值个观察值个观察值个观察值x x的乘积再开的乘积再开的乘积再开的乘积再开n n次方次方次方次方的方根(或各观察值的方根(或各观察值的方根(或各观察值的方根(或各观察值x x对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。其适用条件是:其适用条件是:其适用条件是:其适用条件是:当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。似倍数关系。似倍数关系。似倍数关系。2022/11/292022/11/292424几何均数计算公式:几何均数:几何均数:变量对数值的变量对数值的算术均数的反对数。算术均数的反对数。n n计算几何均数的观察值应大于零 2022/11/292022/11/292525例8.3 有有7 7份血清的抗体效价分份血清的抗体效价分别为别为1:2,1:4,1:8,1:16,1:32,1:2,1:4,1:8,1:16,1:32,1:64,1:128,1:64,1:128,求平均抗体效价。求平均抗体效价。2022/11/292022/11/292626(2)加权法(当观察例数多时采用)(当观察例数多时采用)公式:公式:2022/11/292022/11/292727例8.4 有有6060人的血清抗体效价,分别为人的血清抗体效价,分别为:7:7人人1:51:5,1111人人1:101:10,2222人人1:201:20,1212人人1:401:40,8 8人人1:801:80,求平均抗体效价。,求平均抗体效价。n n50人的血清平均抗体效价为1:20.705。2022/11/292022/11/292828例例8.4 8.4 有有6060人的血清抗体效价,求其平均抗体效价人的血清抗体效价,求其平均抗体效价2022/11/292022/11/292929计算几何均数应该注意的事项v变变量量值值中中不不能能有有0 0或或负负数数,因因为为0 0和和负负数数不不能取对数。能取对数。v不不能能同同时时有有正正有有负负。若若全全部部是是负负值值,计计算算时时可可先先把把负负号号去去掉掉,得得出出结结果果后后,再再加加上上负负号。号。2022/11/292022/11/293030三、三、中位数与百分位数中位数与百分位数(一)中位数(一)中位数(一)中位数(一)中位数(medianmedian)qq定义:用符号定义:用符号定义:用符号定义:用符号M M M M表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,按大小顺序按大小顺序按大小顺序按大小顺序排列排列排列排列,位置居中的数值(位置居中的数值(位置居中的数值(位置居中的数值(n n n n为奇数)或位置居中的两个数值为奇数)或位置居中的两个数值为奇数)或位置居中的两个数值为奇数)或位置居中的两个数值的均值(的均值(的均值(的均值(n n n n为偶数)。为偶数)。为偶数)。为偶数)。qq其适用情况有:其适用情况有:其适用情况有:其适用情况有:当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料的分布情况不清楚资料的分布情况不清楚资料的分布情况不清楚资料的分布情况不清楚。MMe e50%50%2022/11/292022/11/293131计算公式计算公式:n为奇数时为奇数时n为偶数时为偶数时 2022/11/292022/11/293232例8.5 7 7名正常人的血压名正常人的血压(舒张压舒张压)测定测定值值(mmHg)为为:72,75,76,77,81,82,86,求求中位数中位数。n n从小到大排列:72,75,76,77,81,82,86n n若又观察了一个人的血压,为87(mmHg),此时(77+81)/2=79(mmHg)2022/11/292022/11/293333n n例:1,3,7,5,100n 中位数为多少?2022/11/292022/11/293434频数表资料的中位数频数表资料的中位数(P157公式8.5)下限值下限值L L上限值上限值U Ui;fm中位数中位数M M2022/11/292022/11/293535例例例例8.18.18.18.1频数表中位数的计算频数表中位数的计算频数表中位数的计算频数表中位数的计算血糖血糖(mol/L)(mol/L)组段组段组中值组中值()频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.604.604.70 4.70 4.70 4.70 25 25 25 25 86 86 86 86 18.94 18.94 18.94 18.94 65.15 65.15 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132(fi)132(fi)100.00 100.00 n n4.60+(0.20/25)*132/2-61=4.644.60+(0.20/25)*132/2-61=4.642022/11/292022/11/293636 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile)n n把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。n n中位数是第50百分位数,用P5050表示。2022/11/292022/11/2937372022/11/292022/11/293838Trunc()取整函数取整函数 设有设有X个原始数据从小到大排列,第个原始数据从小到大排列,第X百分位数的计算公式为:百分位数的计算公式为:1 1直接计算法直接计算法当当 为带有小数位时:为带有小数位时:当当 为为 整数时:整数时:2022/11/292022/11/293939例例对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,120120名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第5 5百百百百分位数和第分位数和第分位数和第分位数和第9999百分位数。百分位数。百分位数。百分位数。,为整数为整数为整数为整数:患者编号患者编号:住院天数住院天数:(1)n=120,2022/11/292022/11/294040带有小数带有小数(2)故取整故取整 trunc(118.8)=1182022/11/292022/11/2941412 2频数表法频数表法公式:公式:2022/11/292022/11/294242n n 当 时,公式(8.5)即为中位数的计算公式:2022/11/292022/11/294343例例例例8.18.1试分别求例试分别求例试分别求例试分别求例8.18.1频数表的第频数表的第频数表的第频数表的第2525、第、第、第、第7575百分位数。百分位数。百分位数。百分位数。P P25254.20+0.204.20+0.20(132(13225%25%14)/2314)/234.3654.365P P75754.80+0.204.80+0.20(132(13275%75%86)/2086)/204.9304.930血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.603.603.70 3.70 3.70 3.70 3 3 3 3 3 3 3 32.27 2.27 2.27 2.27 2.27 2.27 2.27 2.27 3.803.803.803.803.90 3.90 3.90 3.90 3 3 3 3 6 6 6 6 2.27 2.27 2.27 2.27 4.55 4.55 4.55 4.55 4.004.004.004.004.10 4.10 4.10 4.10 8 8 8 8 14 14 14 14 6.06 6.06 6.06 6.06 10.61 10.61 10.61 10.61 4.204.204.204.204.30 4.30 4.30 4.30 23 23 23 23 37 37 37 37 17.42 17.42 17.42 17.42 28.03 28.03 28.03 28.03 4.404.404.404.404.50 4.50 4.50 4.50 24 24 24 24 61 61 61 61 18.18 18.18 18.18 18.18 46.21 46.21 46.21 46.21 4.604.604.604.604.70 4.70 4.70 4.70 25 25 25 25 86 86 86 86 18.94 18.94 18.94 18.94 65.15 65.15 65.15 65.15 4.804.804.804.804.90 4.90 4.90 4.90 20 20 20 20 106 106 106 106 15.15 15.15 15.15 15.15 80.30 80.30 80.30 80.30 5.005.005.005.005.10 5.10 5.10 5.10 12 12 12 12 118 118 118 118 9.09 9.09 9.09 9.09 89.39 89.39 89.39 89.39 5.205.205.205.205.30 5.30 5.30 5.30 10 10 10 10 128 128 128 128 7.58 7.58 7.58 7.58 96.97 96.97 96.97 96.97 5.405.405.405.405.605.605.605.605.50 5.50 5.50 5.50 4 4 4 4 132 132 132 132 3.03 3.03 3.03 3.03 100.00 100.00 100.00 100.00 合计合计合计合计132(fi)132(fi)132(fi)132(fi)100.00 100.00 100.00 100.00 2022/11/292022/11/294444三种平均数的特点vv算术均数:算术均数:算术均数:算术均数:通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不或特小值)或资料呈偏态分

    注意事项

    本文(数值变量资料的统计描述.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开