(精品)第四讲计量资料的统计描述.ppt
《(精品)第四讲计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《(精品)第四讲计量资料的统计描述.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲 定量资料的统计描述毛广运环境与公共卫生学院环境与公共卫生学院 目的与要求掌握:掌握:掌握:掌握:C C集中集中集中集中趋势趋势和离散程度的描述,和离散程度的描述,和离散程度的描述,和离散程度的描述,C C正正正正态态分布的概念与特征,分布的概念与特征,分布的概念与特征,分布的概念与特征,C C医学参考医学参考医学参考医学参考值值范范范范围围的制定的制定的制定的制定熟悉:熟悉:熟悉:熟悉:C C频频数分布表数分布表数分布表数分布表编编制,制,制,制,C C频频数分布的数分布的数分布的数分布的类类型,型,型,型,C C正正正正态态分布曲分布曲分布曲分布曲线线下面下面下面下面积积分布分布分布
2、分布规规律,律,律,律,C C标标准正准正准正准正态态分布分布分布分布了解:了解:了解:了解:C C质质量控制和量控制和量控制和量控制和统计处统计处理方法的基理方法的基理方法的基理方法的基础础教学内容详细讲解:详细讲解:详细讲解:详细讲解:C C频数分布表的编制和用途;频数分布表的编制和用途;频数分布表的编制和用途;频数分布表的编制和用途;C C集中趋势和离散程度的描述;集中趋势和离散程度的描述;集中趋势和离散程度的描述;集中趋势和离散程度的描述;C C正态分布的概念和特征;正态分布的概念和特征;正态分布的概念和特征;正态分布的概念和特征;C C标准正态分布和标准化变换标准正态分布和标准化变换
3、标准正态分布和标准化变换标准正态分布和标准化变换一般介绍:一般介绍:一般介绍:一般介绍:C C频数分布的类型,频数分布频数分布的类型,频数分布频数分布的类型,频数分布频数分布的类型,频数分布图的绘制方法和用途,质量图的绘制方法和用途,质量图的绘制方法和用途,质量图的绘制方法和用途,质量控制和统计处理方法的基础控制和统计处理方法的基础控制和统计处理方法的基础控制和统计处理方法的基础 重点讲解:重点讲解:重点讲解:重点讲解:C C常用的平均数(算术均数、几常用的平均数(算术均数、几常用的平均数(算术均数、几常用的平均数(算术均数、几何均数和中位数)的意义、应何均数和中位数)的意义、应何均数和中位数
4、)的意义、应何均数和中位数)的意义、应用及计算方法;用及计算方法;用及计算方法;用及计算方法;C C常用的描述离散程度的指标常用的描述离散程度的指标常用的描述离散程度的指标常用的描述离散程度的指标(极差,四分位数间距,方差,(极差,四分位数间距,方差,(极差,四分位数间距,方差,(极差,四分位数间距,方差,标准差和变异系数)的意义、标准差和变异系数)的意义、标准差和变异系数)的意义、标准差和变异系数)的意义、应用和计算方法;应用和计算方法;应用和计算方法;应用和计算方法;C C正态分布的概念,标准正态分正态分布的概念,标准正态分正态分布的概念,标准正态分正态分布的概念,标准正态分布和标准化变换
5、;布和标准化变换;布和标准化变换;布和标准化变换;C C正态分布曲线下面积分布规律,正态分布曲线下面积分布规律,正态分布曲线下面积分布规律,正态分布曲线下面积分布规律,频数估计,参考值范围制定频数估计,参考值范围制定频数估计,参考值范围制定频数估计,参考值范围制定例 2-1以下以下为某某单位位1999年年职工体工体检结果中果中101人人的血清的血清总胆固醇胆固醇(mmol/L)结果(果(P13)第一节频数分布数据整理数据整理C定定义:A根据研究目的和要求,根据研究目的和要求,根据研究目的和要求,根据研究目的和要求,对对收集到的原始数据收集到的原始数据收集到的原始数据收集到的原始数据进进行科学的
6、行科学的行科学的行科学的分分分分类类、汇总汇总和和和和显显示示示示的的的的过过程,即程,即程,即程,即对对数据数据数据数据进进行加工行加工行加工行加工处处理的理的理的理的过过程程程程C目的:目的:A使数据系使数据系使数据系使数据系统统化、条理化、直化、条理化、直化、条理化、直化、条理化、直观观生生生生动动A能能能能够够反映反映反映反映总总体的数量特征与体的数量特征与体的数量特征与体的数量特征与规规律律律律数据整理的内容审核分组汇总编制统计图表数据审核定定义C对对搜集到的搜集到的搜集到的搜集到的资资料料料料进进行行行行审查审查、核、核、核、核实实,以确保,以确保,以确保,以确保统计统计资资料符合
7、料符合料符合料符合统计统计研究目的的要求,研究目的的要求,研究目的的要求,研究目的的要求,资资料料料料完整、准完整、准完整、准完整、准确无确无确无确无误误。方法方法C缺失缺失缺失缺失审审核核核核C逻辑审逻辑审核核核核C计计算算算算审审核核核核计量资料的整理步步骤:C将数据按其将数据按其将数据按其将数据按其类类型分成若干个型分成若干个型分成若干个型分成若干个组别组别C将每一个具体的数据将每一个具体的数据将每一个具体的数据将每一个具体的数据归归入相入相入相入相应应的各的各的各的各组组C计计算各算各算各算各组对应组对应的的的的频频数、数、数、数、频频率率率率C列出列出列出列出频频数分布表数分布表数分
8、布表数分布表几个基本概念频数:数:各各组别中的数据例数中的数据例数频率:率:各各组别中的数据例数占全部数据的百中的数据例数占全部数据的百分比分比频数分布:数分布:各个各个组别及其相及其相应频数的排列数的排列频数分布表:数分布表:以表格的形式所表以表格的形式所表现出来的出来的频数分布数分布编制频数表的步骤求极差求极差求极差求极差(Range,R)(Range,R)C最大最大最大最大值值与最小与最小与最小与最小值值之差之差之差之差确定确定组段数段数C多取多取多取多取10101515组组,以,以,以,以1010组组最最最最为为常用常用常用常用确定确定组距距C全距全距全距全距/组组数数数数C一般多取整
9、数一般多取整数一般多取整数一般多取整数C表表表表现为现为各各各各组组上下限之上下限之上下限之上下限之间间的距离的距离的距离的距离编制频数表的步骤确定确定确定确定组组段段段段C C组组段的本段的本段的本段的本质为质为区区区区间间,上限,上限,上限,上限为为U U,下限,下限,下限,下限为为L LC CLXLXU UC C第一个第一个第一个第一个组组段的下限段的下限段的下限段的下限为为最小最小最小最小值值或稍小于最小或稍小于最小或稍小于最小或稍小于最小值值的数的数的数的数C C最后一个最后一个最后一个最后一个组组段段段段应应包括最大包括最大包括最大包括最大值值或稍大于最大或稍大于最大或稍大于最大或
10、稍大于最大值值的数的数的数的数C C各各各各组组段中除了最后一段中除了最后一段中除了最后一段中除了最后一组为闭组为闭区区区区间间外,其余各外,其余各外,其余各外,其余各组组均均均均为为半半半半开半开半开半开半闭闭区区区区间间分分分分组组划划划划记记并并并并统计频统计频数数数数列出列出列出列出频频数分布表(表数分布表(表数分布表(表数分布表(表2-12-1,表,表,表,表2-22-2)频数分布的构成要素核心要素核心要素:C组组段:段:段:段:总总体按某体按某体按某体按某标标志所分的志所分的志所分的志所分的组组 C频频数:数:数:数:各各各各组组的的的的单单位数叫位数叫位数叫位数叫频频数数数数C频
11、频率率率率A A各各各各组组的的的的单单位数与位数与位数与位数与总总体体体体单单位位位位总总数之比数之比数之比数之比A A频频率的性率的性率的性率的性质质:BB各各各各组频组频率都是界于率都是界于率都是界于率都是界于0 0和和和和1 1之之之之间间的一个分数的一个分数的一个分数的一个分数BB各各各各组频组频率之和等于率之和等于率之和等于率之和等于1 1非核心要素非核心要素C累累积频数数A将将将将频频数表中各数表中各数表中各数表中各组组的的的的频频数逐数逐数逐数逐级级累加累加累加累加所数所数所数所数值值C累累积频率率A将将将将频频数表中各数表中各数表中各数表中各组组的的的的频频率逐率逐率逐率逐级
12、级累加累加累加累加所数所数所数所数值值A最最最最终终的的的的结结果果果果为为100%100%100%100%频数分布的构成要素频数分布图定定定定义义C C以各以各以各以各组组段的段的段的段的组组中中中中值为值为横坐横坐横坐横坐标标,以各,以各,以各,以各组组的的的的频频数数数数为纵为纵坐坐坐坐标标,所,所,所,所绘绘出的出的出的出的条形条形条形条形图图组组中中中中值值C C各各各各组组中点位置所中点位置所中点位置所中点位置所对应对应的的的的变变量量量量值值。C C其其其其计计算公式算公式算公式算公式为为:组组中中中中值值=(适用所有(适用所有(适用所有(适用所有闭闭口口口口组组)或或或或=(适
13、用上开口(适用上开口(适用上开口(适用上开口组组)或或或或=(适用下开口(适用下开口(适用下开口(适用下开口组组)(本组下限本组下限本组下限本组下限+下一组下限下一组下限下一组下限下一组下限)/2)/2)/2)/2频数分布图频数表和频数分布图的用途描述分布描述分布类型型(a)正态分布(b)偏态分布正偏(左偏)负偏(右偏)频数表和频数分布图的用途描述描述频数分布的特征数分布的特征C是否有是否有是否有是否有规规律可言?律可言?律可言?律可言?C是否是否是否是否对对称?称?称?称?发现异常异常值为进一步的分析做准一步的分析做准备第二节 集中趋势集中趋势集中趋势第一节 集中趋势常用指常用指标(平均数)
14、(平均数)(平均数)(平均数)C算算算算术术均数均数均数均数C几何均数几何均数几何均数几何均数C中位数中位数中位数中位数C众数众数众数众数C调调和平均数和平均数和平均数和平均数算术均数定定义C一一一一组组数据全部数据全部数据全部数据全部变变量量量量值值的平均的平均的平均的平均值值,简简称均数称均数称均数称均数(Mean)(Mean)特点特点C考考考考虑虑了一了一了一了一组组数据中所有数据中所有数据中所有数据中所有变变量量量量值值的影响的影响的影响的影响C描述符合正描述符合正描述符合正描述符合正态态分布的数据集中分布的数据集中分布的数据集中分布的数据集中趋势趋势的最佳指的最佳指的最佳指的最佳指标
15、标C样样本均数用本均数用本均数用本均数用X X表示,表示,表示,表示,总总体均数用体均数用体均数用体均数用 表示表示表示表示算术均数的两个重要特征C各离均差的各离均差的总和等于和等于0。A总体中各体中各变量量值X与均数之差称与均数之差称为离均差离均差A(X-)=0C离均差的平方和小于各离均差的平方和小于各观察察值X与任何数与任何数a之差之差的平方和。的平方和。算术均数计算方法计算方法计算方法计算方法C C直接法直接法直接法直接法(适用于例数较少的数据适用于例数较少的数据适用于例数较少的数据适用于例数较少的数据)C C间接法间接法间接法间接法(频数表法频数表法频数表法频数表法)C C本法中均数的
16、大小受各组的组中值和频数的影响,其中本法中均数的大小受各组的组中值和频数的影响,其中本法中均数的大小受各组的组中值和频数的影响,其中本法中均数的大小受各组的组中值和频数的影响,其中各组的频数称之各组的频数称之各组的频数称之各组的频数称之权数权数权数权数,对应的频率称之为,对应的频率称之为,对应的频率称之为,对应的频率称之为权重权重权重权重。C软件法软件法(最常用最常用)计算算术均数的SAS程序datadata tmp;tmp;input x;input x;cards;cards;2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.
17、41 4.78 3.95 3.92 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.
18、95 5.08 4.53 3.92 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.
19、71 3.30 4.73 4.17 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.263.8
20、6 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26;procproc meansmeans mean maxdec=mean maxdec=2 2;runrun;几何平均数定定义C一一一一组组数据中数据中数据中数据中N N个个个个变变量量量量值值乘乘乘乘积积的的的的N N次方根称之次方根称之次方根称之次方根称之为为几几几几何平均数何平均数何平均数何平均数(Gemetric mean,G)(Gemetric mean,G)特点特点C适用于符合适用于符合适用于符合适用于符合对对数正数正数正数正态态分布分布分布分布C数据不能数据不能数据不能数据不能
21、为为0 0或或或或负负数数数数几何平均数计算方法计算方法计算方法计算方法C C直接法直接法直接法直接法A AG=G=lg-1(lgX1+lgX2+lgX3+lgXn)/nC C间接法间接法间接法间接法C软件法软件法(需要编程需要编程)几何均数的SAS程序data ex2_5;data ex2_5;input x f;input x f;y=log10(x);y=log10(x);cards;cards;10 410 420 320 340 1040 1080 1080 10160 11160 11320 15320 15640 14640 141280 21280 2;proc means n
22、oprint;proc means noprint;var y;var y;freq f;freq f;output out=b output out=b mean=logmean;mean=logmean;run;run;data c;data c;set b;set b;g=10*logmean;g=10*logmean;proc print data=c;proc print data=c;var g;var g;run;run;中位数定定定定义义C将一将一组变量量值从小到大按从小到大按顺序排序,位次居中的那个序排序,位次居中的那个变量量值就是就是中位数中位数(median,M)特点特点
23、特点特点C位置代表位置代表值C既可以是原始数据中的某个具体既可以是原始数据中的某个具体值,也可以不是具体,也可以不是具体值C一半的数据比一半的数据比M大,一半的数据比大,一半的数据比M小小C不受极端不受极端值的影响的影响C代表性不好代表性不好(未考未考虑样本中的所有数据本中的所有数据)中位数计计算方法算方法算方法算方法C C直接法直接法直接法直接法(适用于适用于适用于适用于样样本例数本例数本例数本例数较较小的小的小的小的资资料料料料)A A将数据按从小到大的将数据按从小到大的将数据按从小到大的将数据按从小到大的顺顺序排列序排列序排列序排列A A当当当当n n为为奇数奇数奇数奇数时时,中位数就是
24、位置居中的那个数,中位数就是位置居中的那个数,中位数就是位置居中的那个数,中位数就是位置居中的那个数值值,即,即,即,即M=XM=X(n+1)/2(n+1)/2A A当当当当n n为为偶数偶数偶数偶数时时,M=(XM=(Xn/2n/2+X+X(n+2)/2(n+2)/2)/2)/2A A举举例:例例:例例:例例:例4.44.4C C间间接法接法接法接法A A频频数表法数表法数表法数表法C软件法件法(最常用最常用)百分位数把数据从小到大排列后位于把数据从小到大排列后位于第第X%位置的数位置的数值。C有n个观察值X1,X2Xn,把他们由小到大按顺序排列成X1X2X3Xn,将这n个观察值平均平均分为
25、100等份,对应于每一等份的数值就是一个百分位数,对应于前面于前面X%个位置的数个位置的数值称称为第第X百分位数百分位数,用,用Px表示。表示。C一个百分位数Px将总体或样本的全部观察值分为两部分,理论上,在不包括Px的全部数据中有X%的观察值比它小,有(100-X)%的观察值比它大。四分位数定定定定义义C C将全部数据等分成四个部分,每一部分均包含了将全部数据等分成四个部分,每一部分均包含了将全部数据等分成四个部分,每一部分均包含了将全部数据等分成四个部分,每一部分均包含了25%25%的数据,的数据,的数据,的数据,25%25%、50%50%和和和和75%75%分位点上的数分位点上的数分位点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 第四 计量 资料 统计 描述
限制150内