统计基础三统计描述.pptx
《统计基础三统计描述.pptx》由会员分享,可在线阅读,更多相关《统计基础三统计描述.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计描述与统计推断统计描述 -对数据进行收集和描述的一些方法,以得出有意义的信息统计推断 -对部分样本数据进行分析的方法,以得出对总体的预测或推断第1页/共37页统计描述-概要第2页/共37页数字量度描述数据的特性主要的数字量度:1、位置量度(中心)-分布集中趋势的测度2、离散量度(变化)-分布离散程度的测度3、形状量度(分布)-分布偏态与峰度的测度第3页/共37页1、位置量度(Measures of Location)平均值算术平均(Mean或Xbar)几何平均(G)调和平均(H)取舍平均(TrMean)中位数(Median)众数(Mode)四分位数(Quartiles)第4页/共37页平均
2、值设有n个观察样本 x1,x2,.,xn,则样本均值为平均值是最常用的衡量位置或数据中心的量.第5页/共37页平均值设观察的总体中有N 个个体,现从中抽取n个个体进行观察,则 样本均值(sample mean)为而总体均值(population mean)(记为)则为通常总体均值是未知的,可用样本均值来估计总体均值.第6页/共37页例在1991年海湾战争的“沙漠风暴”行动中,美国空军(USAF)的 F-117A战机共出动了1270次战斗,持续时间共6905小时.因此,在这次行动中一次F-117A 任务的平均持续时间为第7页/共37页中位数(Median)把样本x1,x2,.,xn 从小到大重新
3、排列得 x(1),x(2),.,x(n),则样本中位数(sample median)定义为中位数的一个优点是具有稳健性,受极值的影响不大.如果如果n是奇数是奇数如果如果n是偶数是偶数第8页/共37页例设样本观察值为 1 3 4 2 7 8 6 则样本均值和样本中位数分别为4.4和 4.它们都 可以合理地反映这些数据的中心位置.如果最后一个观察值改为 1 3 4 2 7 8 2450 则样本均值为 353.6 而样本中位数保持不变.第9页/共37页众数(Mode)众数是指样本中出现次数最多的观察值.众数可以是唯一的,也可以有多个,也可以不存在.第10页/共37页例设观察值为3 6 9 3 5 8
4、 3 4 6 3 1 10 则样本众数是 3.(出现了4次)设观察值为3 6 9 3 5 8 3 4 6 3 1 10 6 2 5 6 则样本众数有两个:3和6.(各出现了4次)设观察值为1 3 4 2 7 6 8 则样本众数不存在.第11页/共37页区分区分特征特征优点优点缺点缺点均值均值Xbar1、全部数据的算术平均;、全部数据的算术平均;2、各变量值与其均值的离差之和等于各变量值与其均值的离差之和等于0;3、各变量值与其均值的离差平方和最小;、各变量值与其均值的离差平方和最小;4、调和平均(、调和平均(HM)主要用于不能直接计算均值主要用于不能直接计算均值的数据;的数据;5、几何平均(、
5、几何平均(GM)则主要用于计算比率数据的则主要用于计算比率数据的平均数平均数6、只适用于定距(、只适用于定距(G和和H外)或定比尺度的数据外)或定比尺度的数据1、反映事物的必然性特征;、反映事物的必然性特征;2、是统计分析与统计推断的、是统计分析与统计推断的基础;基础;3、应用最广泛;、应用最广泛;4、当数据呈对称分布或接近、当数据呈对称分布或接近对称分布时,三个代表值相对称分布时,三个代表值相等或接近相等,应首选均值等或接近相等,应首选均值1、易受数据极端值的影响;、易受数据极端值的影响;2、对于偏态分布的数据,其、对于偏态分布的数据,其代表性较差代表性较差众数众数Mo1、是一组数据分布的峰
6、值;、是一组数据分布的峰值;2、可适用于、可适用于4种度量尺度的数据种度量尺度的数据1、易于理解、易于理解2、不受极端值的影响;、不受极端值的影响;3、当数据的分布具有明显的、当数据的分布具有明显的集中趋势时,尤其是对于偏集中趋势时,尤其是对于偏态分布,其代表性比均值要态分布,其代表性比均值要好好1、不具有唯一性、不具有唯一性中位数中位数Me1、是处于一组数据中间位置上的代表值;、是处于一组数据中间位置上的代表值;2、可适用于、可适用于4种度量尺度的数据种度量尺度的数据1、不受极端值的影响;、不受极端值的影响;众数、中位数和均值的特点及应用场合第12页/共37页条件特征表达式示意图若数据具有单
7、一众数若数据具有单一众数,且分布是且分布是对称对称的的Mo=Me=Xbar若数据是若数据是左左偏分布偏分布说明数据存在极小值说明数据存在极小值,必然拉必然拉动均值向极小值一方靠动均值向极小值一方靠,而而Mo和和Me不受极值的影响不受极值的影响XbarMeMo若数据是若数据是右右偏分布偏分布说明数据存在极大值说明数据存在极大值,必然拉必然拉动均值向极大值一方靠动均值向极大值一方靠MoMe Xbar众数、中位数和均值的关系频数频数频数第13页/共37页四分位数(Quartiles)当一个有序数据集被划分为四个相等的部分,则划分点就称为四分位点(quartiles).第一分位点(或下分位点)q1 指
8、小于它的观察值约占25%的点.第二分位点(或中位数)q2 指小于它的观察值约占50%的点.第三分位点(或上分位点)q3 指小于它的观察值约占75%的点.第14页/共37页例把20个绝缘材料的失效时间(单位:小时)的观察值由小到大排列如下 204 228 252 300 324 444 624 720 816 9121176 1296 1392 1488 1512 2520 2856 3192 3528 3710 则第15页/共37页2、离散量度(Measures of Dispersion)极差(Range)方差(Variance)标准差(Standard Deviation)内分位极差(In
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 基础 三统 描述
限制150内