《卫生统计学-定量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《卫生统计学-定量资料的统计描述.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、定量资料的统计描述定量资料的统计描述实习目的和要求实习目的和要求根据分析目的和资料特点选用适当的统根据分析目的和资料特点选用适当的统计分析方法;计分析方法;熟悉常用统计方法的熟悉常用统计方法的SPSS操作步骤;操作步骤;SPSS运行结果的表达和解释。运行结果的表达和解释。本次实习的目的和要求运用运用SPSS进行定量资料的统计描述进行定量资料的统计描述(包括统计指标、统计图);(包括统计指标、统计图);掌握结果的分析和解释(通过对资料的掌握结果的分析和解释(通过对资料的描述能判断其分布类型)。描述能判断其分布类型)。定定量资料的统计描述量资料的统计描述1、SPSS的操作过程的操作过程2、定量资料
2、统计描述的四个常用过程、定量资料统计描述的四个常用过程3、正态分布、正态分布复习复习资料的两种类型资料的两种类型定量资料定量资料?定性资料定性资料n统计分析的内容统计分析的内容统计描述:统计图表,统计指标统计描述:统计图表,统计指标统计推断:统计推断:包括参数估计和假设检验包括参数估计和假设检验定量资料的统计描述定量资料的统计描述统计表格:频数分布表(连续型定量资料)统计表格:频数分布表(连续型定量资料)统计图:直方图(连续型定量资料)直条图(离统计图:直方图(连续型定量资料)直条图(离散型定量资料)散型定量资料)统计指标统计指标 集中趋势:均数、几何均数、中位数集中趋势:均数、几何均数、中位
3、数离散趋势:极差、方差、标准差、四离散趋势:极差、方差、标准差、四分位间距等分位间距等定量资料的统计描述定量资料的统计描述-集中趋势集中趋势算数均数算数均数(mean)适适适适用用用用条条条条件件件件:对对对对称称称称分分分分布布布布,特特特特别别别别是是是是正正正正态态态态或或或或者者者者近近近近似似似似正正正正态态态态分分分分布的资料。布的资料。布的资料。布的资料。几何均数几何均数(geometric mean)适适适适用用用用条条条条件件件件:偏偏偏偏态态态态分分分分布布布布,但但但但是是是是经经经经过过过过对对对对数数数数变变变变换换换换之之之之后后后后呈呈呈呈正正正正态或近似正态分布
4、的资料。态或近似正态分布的资料。态或近似正态分布的资料。态或近似正态分布的资料。中位数中位数(median)适适适适用用用用条条条条件件件件:偏偏偏偏态态态态分分分分布布布布资资资资料料料料及及及及两两两两端端端端无无无无确确确确切切切切值值值值或或或或分分分分布布布布不不不不明确的资料。明确的资料。明确的资料。明确的资料。定量资料的统计描述定量资料的统计描述-离散程度离散程度极差极差(range)适用条件适用条件适用条件适用条件:单峰小样本资料,初步描述。:单峰小样本资料,初步描述。:单峰小样本资料,初步描述。:单峰小样本资料,初步描述。四分位间距四分位间距(inter-quartile r
5、ange)适适适适用用用用条条条条件件件件:偏偏偏偏态态态态分分分分布布布布资资资资料料料料及及及及两两两两端端端端无无无无确确确确切切切切值值值值或或或或分分分分布布布布不不不不明明明明确的资料。确的资料。确的资料。确的资料。方差与标准差方差与标准差(variance,standard deviation)适适适适用用用用条条条条件件件件:对对对对称称称称分分分分布布布布,特特特特别别别别是是是是正正正正态态态态或或或或者者者者近近近近似似似似正正正正态态态态分分分分布布布布的资料。的资料。的资料。的资料。变异系数变异系数(CV)适用条件适用条件适用条件适用条件:比较度量单位不同或均数相差悬
6、殊的资料:比较度量单位不同或均数相差悬殊的资料:比较度量单位不同或均数相差悬殊的资料:比较度量单位不同或均数相差悬殊的资料描述定量变量指标的正确选择描述定量变量指标的正确选择正态或近似正态分布的资料正态或近似正态分布的资料 均数和标准差均数和标准差均数和标准差均数和标准差偏态分布的资料偏态分布的资料 中位数和四分位数间距中位数和四分位数间距中位数和四分位数间距中位数和四分位数间距等比级数或对数正态分布的资料等比级数或对数正态分布的资料 几何均数和四分位数间距几何均数和四分位数间距几何均数和四分位数间距几何均数和四分位数间距正态分布正态分布的判断正态分布的判断1.均数与中位数的比较均数与中位数的
7、比较2.频数表频数表3.直方图,直方图,P-P图,图,Q-Q图图4.正态性检验正态性检验:单峰对称单峰对称操作步骤:操作步骤:Analyze-descriptive-exploreAnalyze-descriptive-explore-plots histogram-plots histogram normality plots with test normality plots with test正态性检验 -explore命令2 2、Q-QQ-Q图图做法:做法:以样本的以样本的以样本的以样本的分位数分位数分位数分位数作为横坐标,以按照正态分布计算作为横坐标,以按照正态分布计算作为横坐标,以
8、按照正态分布计算作为横坐标,以按照正态分布计算的相应分位数作为纵坐标,把样本表现为直角坐标的相应分位数作为纵坐标,把样本表现为直角坐标的相应分位数作为纵坐标,把样本表现为直角坐标的相应分位数作为纵坐标,把样本表现为直角坐标系的散点。系的散点。系的散点。系的散点。结果结果 如果资料服从正态分布,则样本点应该呈一条围绕如果资料服从正态分布,则样本点应该呈一条围绕如果资料服从正态分布,则样本点应该呈一条围绕如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。第一象限对角线的直线。第一象限对角线的直线。第一象限对角线的直线。3 3、其他、其他直方图、直方图、W W检验、检验、D D检验、
9、矩法检验等检验、矩法检验等矩法检验:分别对总体分布的偏度矩法检验:分别对总体分布的偏度SKEWSKEW和和 峰峰度度KURTKURT进行检验。两者都不拒接零假设,进行检验。两者都不拒接零假设,则认为是正态分布。则认为是正态分布。SPSS操作过程SPSS中实现定量资料统计中实现定量资料统计描述描述的四个的四个常用过程常用过程nFrequencies过程过程nDescriptives过程过程nExplore过程过程nRatio过程过程Frequencies过程过程:涉及的统计指标比涉及的统计指标比Descriptives过程全过程全面,并给出常用统计图。面,并给出常用统计图。还可以对还可以对分类资
10、料以及不服从正态分分类资料以及不服从正态分布的布的资料进行描述资料进行描述1、Frequencies 过程的对话框与选择项(1)Frequencies 过程的对话框 Statistics对话框:charts对话框format对话框练习:1、1985年某省农村120例6-7岁正常男童胸围测量结果。Trunc(cc/1.5)*1.52、某市1974年为了了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝肾疾病,无汞作业接触史的居民238人的发汞含量(umol/kg),试做频数表分析。发汞值(x)1.53.55.57.59.511.513.515.517.519
11、.521.5人数(f)2066604818166103表1 238人的发汞含量(umol/kg)操作步骤:1、dataweight cases(加权过程)2、frequencise过程Descriptives过程过程u进行一般性的统计描述(统计指标);进行一般性的统计描述(统计指标);u适用于适用于服从正态分布服从正态分布的定量资料;的定量资料;u特殊功能:可对特殊功能:可对原变量进行标准正态变原变量进行标准正态变换。换。Options:选择按钮例:一个医生观察了一组住院病人,共24名患者的资料,请对男性病人、全部病人的age、x1、x2进行描述性分析,见excel表格(病人基本资料.xls)
12、1、dataselect cases选择if condition is satisfied,激活if对话框单击性别,放入输入栏,赋值=1,continue制作频数分布表以男童胸围为例:Descriptive Statistics NRangeMinimum Maximum 120 12.7 49.1 61.8 Valid N(listwise)120 根据极差12.7,确定分为9个组,组距为1.5,各组分别为49-50.5,50.5-52.步骤:transformcompute ExploreExplore过程过程lAnalyze lDescriptive Statistics lExplor
13、elDependent List框:要分析变量框:要分析变量lPlotslNormality plots with testlContinuelOK请对男性和女性身高数据分别进行描述:Factor list:用于选入分组变量,将对应变量的所有数据,用于选入分组变量,将对应变量的所有数据,按该因素的取值分组分析。本例为按按该因素的取值分组分析。本例为按性别性别分组。分组。注意:注意:plots按钮:数据转换、齐性检验和正态分布检验按钮:数据转换、齐性检验和正态分布检验均在此对话框中设定均在此对话框中设定(2)statistics对话框Descriptives:给出描述性统计指标。包括均数、均数可
14、信限,5%修整后均数、总和、中位数、标准差、方差、全距、最小值、最大值、标准误、四分位数范围,峰度系数、偏度系数及其标准误。系统默认值。Confidence interval for mean:均数可信限范围,选定Descriptives后才有效,默认为90%,可以修改M-estimators:选定后,结果给出反应集中趋势的四种最大似然估计量,分别为Huvers,Andrews,Hampels,Tukeys估计量。一般在数据中存在奇异值或数据呈长尾的对称性分布时选用。Outliers:选定后,结果给出奇异值(数据中前五位最大值和最小值)。Percentiles:选定后,结果给5,10,25,5
15、0,75,90,95百分位数,和Tukeys折点(相当于四分位数)(3)plots对话框Power etimation:数据转换所得方差齐性的力度估计,并对每组的检验变量,中位数自然对数和四分位数间范围自然对数,做方差齐性检验和散点图。可以帮助决定是否需要做数据转换。Transformed:对转换后数据做方差齐性检验和分布-水平散点图,选定后在右侧的power栏,选择数据转化方式。有五种可选:natural log(自然对数转换)1/square root(平方根倒数转换)Reciprocal(倒数转换)Square root(平方根转换 Square(平方转换)Cube(立方转换)unTransformed:不做数据转换,给出原始数据的方差齐性检验及分布-水平散点图。(4)options对话框Exclude cases listwise:所有变量中有任一个含缺失值所有变量中有任一个含缺失值的个体在所有分析中均被忽略,系统默认。的个体在所有分析中均被忽略,系统默认。Exclude cases pairwise:分析中检验变量含缺失值的:分析中检验变量含缺失值的个体被忽略。个体被忽略。Report values:将缺失值作为分组之一。:将缺失值作为分组之一。练习:请对不同性别的空腹血糖和igf-1进行描述
限制150内