4第五章 描述性统计分析.ppt





《4第五章 描述性统计分析.ppt》由会员分享,可在线阅读,更多相关《4第五章 描述性统计分析.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 描述性统计分析描述性统计分析5.1 统计常用的名词术语统计常用的名词术语5.2 描述性统计分析描述性统计分析练习练习5.1常用的名词术语常用的名词术语总体:总体:根据研究目的而确定的、符合指定条件的全体观根据研究目的而确定的、符合指定条件的全体观察对象所构成的集合称为总体。察对象所构成的集合称为总体。1.总体与样本总体与样本样样本:本:在抽在抽样调查样调查中中观观察的所有个体的集合称察的所有个体的集合称为样为样本。本。样样本容量本容量:样样本中的个体数称本中的个体数称为样为样本容量,本容量,记为记为n。连续型随机变量连续型随机变量在定义域范围内可以取任意实数在定义域范围内可以取任
2、意实数值的变量是连续型随机变量值的变量是连续型随机变量 离散型随机变量离散型随机变量在定义域范围内只可以取一些不连在定义域范围内只可以取一些不连续实数值的变量是离散型随机变量。续实数值的变量是离散型随机变量。2.变量变量反映总体某一性状的数量标法叫变量。反映总体某一性状的数量标法叫变量。其测定数值叫观察值。其测定数值叫观察值。变量分两类型:变量分两类型:数值型数值型变量:用数值进行记录变量:用数值进行记录字符型字符型变量变量:用字符进行记录用字符进行记录数值型变量又分:数值型变量又分:3.3.参数与统计量参数与统计量参数:指由总体的全部观察值而算得的总体特征数。参数:指由总体的全部观察值而算得
3、的总体特征数。统计量:指由样本的全部观察值而算得的样本特征数。统计量:指由样本的全部观察值而算得的样本特征数。统计统计分析的核心分析的核心在于由在于由样样本的情况推断集本的情况推断集团团的信息,的信息,保保证证一定精确度、可靠度。一定精确度、可靠度。计算统计量描 述抽样推断总 体样 本统计量 4.常用的统计量常用的统计量(1).(1).表表现现数据的集中数据的集中趋势趋势-平均数平均数(2).(2).反映反映资资料料变变异度(离散特性)的异度(离散特性)的统计统计量量 -极差、方差、极差、方差、标标准差、准差、变变异系数等异系数等(3).(3).描述分布形状的量描述分布形状的量-峰度系数和偏度
4、系数峰度系数和偏度系数几何平均数(几何平均数(G):是个数值乘积的次方根。):是个数值乘积的次方根。对计算平均增长率具有独特的应用价值。对计算平均增长率具有独特的应用价值。中位数(中位数(Md):如果一组数据按大小顺序排列,):如果一组数据按大小顺序排列,中间位置的数值即为中位数。中间位置的数值即为中位数。众数(众数(Mo):是样本里具有次数最多的那个数值。):是样本里具有次数最多的那个数值。算算术术平均数平均数:(1).(1).表现数据的集中趋势表现数据的集中趋势的量的量-平均数平均数应应用最普遍的是算用最普遍的是算术术平均数。平均数。(复习)复习)(2 2)反映资料变异度(离散特性)的统计
5、量反映资料变异度(离散特性)的统计量 -极差、方差、极差、方差、标标准差、准差、变变异系数异系数复习:复习:1.1.标标准差准差:S:刻画平均到每一独立数据的变异度,估计试验误差。:刻画平均到每一独立数据的变异度,估计试验误差。CV:CV:比比较较两个两个样样本的本的变变异度(由于异度(由于单单位不同或均数不同)位不同或均数不同)2.2.变变异系数异系数:3.标准误标准误:反映同一个集反映同一个集团团内抽内抽样样所得的所得的样样本平均数本平均数间间的差异。的差异。实例实例(3 3)描述分布形状的量描述分布形状的量2.2.峰度系数(峰度系数(KurtosisKurtosis)分布在均分布在均值值
6、两两侧侧极端数据有多少的度量。极端数据有多少的度量。峰度峰度0 0 两侧极端数据较多,两侧极端数据较多,呈偏平式分布呈偏平式分布.峰度峰度0 分布分布对对称称右偏分布的偏度为正数;左偏分布的偏度为负数。右偏分布的偏度为正数;左偏分布的偏度为负数。(复习)复习)1.1.偏度系数(偏度系数(SkewnessSkewness)是以正态分布为标准来描述样本数据对称性的统计量。是以正态分布为标准来描述样本数据对称性的统计量。一、常用一、常用SAS过程过程1 1、MEANS MEANS 过过程程 格式:格式:proc means proc means 选项选项;varvar 分析分析变变量表;量表;by
7、by 分分组变组变量;量;class class 分分类变类变量表;量表;freq freq 频频数数变变量;量;output out=output out=数据集数据集 ;例例:proc means mean std maxdec=2;var x1;2 2、UNIVARIATEUNIVARIATE过过程程 格式:格式:proc proc univariateunivariate 选项选项;varvar 分析分析变变量表;量表;3、两过程比较:、两过程比较:UNIVARIATE过程除可计算基本统计量外,重点过程除可计算基本统计量外,重点在于在于描述变量的分布描述变量的分布。其中选项:其中选项:
8、freq产生频数和累积频数分布表。产生频数和累积频数分布表。normal 进行正态性检验进行正态性检验 plot 生成统计图生成统计图4 4、MEANS过程所计算的统计量(关键词)及其含义:过程所计算的统计量(关键词)及其含义:关关键词键词统计统计量量关关键词键词统计统计量量MinMinMaxMaxRangeRangeSum Sum MeanMeanVarVarStdStdStderrStderrCssCssussuss最小最小值值最大最大值值极差极差和和均均值值方差方差标标准差准差标标准准误误平方和平方和平方总和平方总和N NNmissNmissCVCVKurtosisKurtosisske
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 4第五章 描述性统计分析 第五 描述 统计分析

限制150内