数值变量资料的统计描述.ppt
《数值变量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计描述.ppt(112页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 数值变量资料的统计描述数值变量资料的统计描述2022/11/292022/11/291 1回顾回顾:根据是否定量划分根据是否定量划分根据是否定量划分根据是否定量划分,资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型:n n数值资料数值资料数值资料数值资料(measurement data):(measurement data):(measurement data):(measurement data):用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测
2、量得到的资料,亦称作亦称作亦称作亦称作计量资料计量资料计量资料计量资料。n n分类变量资料分类变量资料分类变量资料分类变量资料(enumeration data):(enumeration data):(enumeration data):(enumeration data):用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料,亦称亦称亦称亦称计数资料。计数资料。计数资料。计数资料。n n等级资料等级资料等级资料等级资料(ranked data):(ranked data):(ranked data):(ranked data):不能精确测量不能精确测量不
3、能精确测量不能精确测量,仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。2022/11/292022/11/292 2第一节 数值变量资料频数分布 数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。数分布表或分布图
4、了解资料的分布特征。数分布表或分布图了解资料的分布特征。数分布表或分布图了解资料的分布特征。一、频数分布表及其制作一、频数分布表及其制作 2022/11/292022/11/293 3例例8.1 8.1 某地区某地区20022002年年55555858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测定值如下,试编制频数表和观察频数分布情况。测定值如下,试编制频数表和观察频数分布情况。5.175.175.565.564.864.864.874.874.744.745.245.245.515.514.464.464.964.964.824.824.904.905.305.
5、305.225.225.585.584.484.484.804.804.64.64.024.025.165.165.365.364.344.344.244.244.644.644.274.274.254.254.444.444.464.464.624.624.874.874.344.344.904.905.255.254.774.774.854.855.075.074.164.164.664.664.704.704.204.203.953.954.094.094.644.644.334.335.215.214.614.614.984.985.245.244.604.604.254.254.78
6、4.785.005.003.603.603.603.604.114.114.614.614.084.084.784.784.264.264.444.444.384.384.44.44.794.794.764.764.924.924.604.604.784.785.035.034.354.354.184.184.684.684.654.654.574.574.274.274.994.994.214.214.894.894.714.714.724.724.414.414.384.384.064.064.794.794.964.964.834.834.454.454.514.514.274.274.
7、504.504.314.315.055.055.595.595.595.595.085.085.165.163.743.744.364.365.365.364.644.645.095.094.574.574.464.464.564.564.394.395.245.244.614.614.214.214.964.964.344.344.454.454.864.864.504.504.904.904.454.454.494.494.424.424.684.684.564.565.385.384.344.344.464.464.164.164.984.984.294.294.834.834.274.
8、273.683.683.853.853.863.864.564.564.564.564.554.555.165.165.155.155.165.162022/11/292022/11/294 4编制频数分布表的步骤编制频数分布表的步骤计计算算极极差差编制频数分编制频数分布表的步骤布表的步骤确确定定组组数数组组距距计计算算频频数数编编制制表表格格2022/11/292022/11/295 5频数表的编制步骤频数表的编制步骤:(1 1)求极差求极差(rangerange):即最大值与最小值之差,又称):即最大值与最小值之差,又称为全距。为全距。R R5.593.60=1.99(mol/L)5.59
9、3.60=1.99(mol/L)(2 2)决定组数、组段和组距:决定组数、组段和组距:根据研究目的和样本含量根据研究目的和样本含量n n确定分组组数。相邻两组段下限值之差称组距,组距确定分组组数。相邻两组段下限值之差称组距,组距=极极差差/组数,为方便计,组距为极差的十分之一组数,为方便计,组距为极差的十分之一,再略加调再略加调整。整。1.99/10 =0.199 0.2(mol/L)1.99/10 =0.199 0.2(mol/L)(3 3)列出组段列出组段:第一组段的下限必须包含最小值,最:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。后一个组段上限必须大于或等于最大
10、值。3.63.6 3.8 3.8 5.2 5.2 5.4 5.4 5.6 5.6(4 4)划记计数划记计数:用划记法将所有数据归纳到各组段,:用划记法将所有数据归纳到各组段,得到各组段的频数。得到各组段的频数。2022/11/292022/11/296 62022/11/292022/11/297 7表8-1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3
11、3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 2
12、0 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132132100.00 100.00 2022/11/292022/11/298 8血糖血糖(mol/L)人人数数图图图图8-18-18-18-1某地区某地区某地区某地区200
13、2200220022002年年年年55555555 58585858岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)(mmol/L)(mmol/L)测定值的频数分布图测定值的频数分布图测定值的频数分布图测定值的频数分布图二、频数分布图二、频数分布图2022/11/292022/11/299 9 同一组资料,不同的人编制的同一组资料,不同的人编制的频数表,结果不尽相同,允许几个频数表,结果不尽相同,允许几个合理的结果并存。合理的结果并存。2022/11/292022/11/291010三、频数表和频数分布图用途三、频数表和频数分布图
14、用途1 1描述频数分布的类型描述频数分布的类型描述频数分布的类型描述频数分布的类型(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)2 2描述频数分布的特征描述频数分布的特征描述频数分布的特征描述频数分布的特征(集中趋势集中趋势集中趋势集中趋势 离散趋势)离散趋势)离散趋势)离散趋势)3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值4 4便于便于便于便于进一步做统计分析进一步做统计分析进一步做统计分析进一步做统计分析和处理(加权)和处理(加权)和处理(加权)和处理(加权)2022
15、/11/292022/11/291111(1 1 1 1)对称分布)对称分布)对称分布)对称分布 :若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布1描述频数分布的类型(对称分布、偏态分布)描述频数分布的类型(对称分布、偏态分布)2022/11/292022/11/291212(2)偏态分布)偏态分布:n n1 1)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段
16、)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。n n2 2)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布):左侧的组段左侧的组段左侧的组段左侧的组段数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。2022/11/292022/11/291313正偏态(右偏态)正偏态(右偏态)负偏
17、态(左偏态)负偏态(左偏态)返回2022/11/292022/11/291414频数分布的类型频数分布的类型对称分布对称分布对称分布正偏态分布正偏态分布正偏态分布负偏态分布负偏态分布负偏态分布2022/11/292022/11/2915152 2描述频数分布的特征描述频数分布的特征图图图图8-18-1(P P154154)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:数据数据数据数据变异(离散)变异(离散)变异(离散)变异(离散)的范围在的范围在的范围在的范围在3.605.60(mol/L3.605.60(mol/L)数据数据数据数据集中(平均)集中(平
18、均)集中(平均)集中(平均)的组段的组段的组段的组段在在在在4.205.00(mol/L4.205.00(mol/L)之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数4.604.804.604.80(mol/L(mol/L)最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频数分布基本对称。数分布基本对称。数分布基本对称。数分布基本对称。返回2022/11/292022/11/2916163便于发现一些特大或特小的可疑值返回2022/11/292022/11/291717第二节 集中趋势指标n n统计上使用统计上使用统计上使用统计上使
19、用平均数(平均数(平均数(平均数(averageaverageaverageaverage)这一指标体系来描这一指标体系来描这一指标体系来描这一指标体系来描述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。n n常用的平均数有常用的平均数有常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(算术均数(均数)(算术均数(均数)(meanmeanmeanmean)几何均数(几何均数(几何均数(几何均数(geometric meangeometric meangeometric meangeometr
20、ic mean)中位数中位数中位数中位数 (medianmedianmedianmedian)百分位数(百分位数(百分位数(百分位数(percentilepercentilepercentilepercentile)2022/11/292022/11/291818一、算术均数算术均数:简称均数(算术均数:简称均数(meanmean)n n定定义义:是是一一组组变变量量值值之之和和除除以以变变量量值值个个数数所所得得的的商商。均均数数适适用用于于资资料料呈呈正正态态分分布布(或近似正态或对称分布)资料(或近似正态或对称分布)资料。n n总体均数总体均数:样本均数样本均数:x2022/11/292
21、022/11/2919191、计算方法(1 1)直接计算法)直接计算法)直接计算法)直接计算法 公式公式:例例例例8.28.28.28.2有有有有9 9 9 9名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值(mol/L)(mol/L)(mol/L)(mol/L)为为为为:5.61:5.61:5.61:5.61,3.963.963.963.96,3.673.673.673.67,4.994.994.994.99,4.244.244.244.24,5.065.065.065.06,5.205.205.205.20,4.794.794
22、.794.79,5.935.935.935.93求算术平均数。求算术平均数。求算术平均数。求算术平均数。x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9 =4.83(mol/L)=4.83(mol/L)2022/11/292022/11/292020例例8.1 8.1 某地区某地区20022002年年5555 5858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测测定值如下,试编制频数表和观察频数分布情况。定值如下,试编制频数表和观察频
23、数分布情况。5.175.175.175.175.565.565.565.564.864.864.864.864.874.874.874.874.744.744.744.745.245.245.245.245.515.515.515.514.464.464.464.464.964.964.964.964.824.824.824.824.904.904.904.905.305.305.305.305.225.225.225.225.585.585.585.584.484.484.484.484.804.804.804.804.64.64.64.64.024.024.024.025.165.165.
24、165.165.365.365.365.364.344.344.344.344.244.244.244.244.644.644.644.644.274.274.274.274.254.254.254.254.444.444.444.444.464.464.464.464.624.624.624.624.874.874.874.874.344.344.344.344.904.904.904.905.255.255.255.254.774.774.774.774.854.854.854.855.075.075.075.074.164.164.164.164.664.664.664.664.704.
25、704.704.704.24.24.24.23.953.953.953.954.094.094.094.094.644.644.644.644.334.334.334.335.215.215.215.214.614.614.614.614.984.984.984.985.245.245.245.244.604.604.604.604.254.254.254.254.784.784.784.785.005.005.005.003.603.603.603.604.114.114.114.114.614.614.614.614.084.084.084.084.784.784.784.784.264.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数值 变量 资料 统计 描述
限制150内