第6章-统计量及其抽样分布.ppt
《第6章-统计量及其抽样分布.ppt》由会员分享,可在线阅读,更多相关《第6章-统计量及其抽样分布.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 6 章 统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.6 两个样本平均值之差的分布两个样本平均值之差的分布6.7 关于样本方差的分布关于样本方差的分布 6.1 统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充分统计量 6.1.1 统计量的概念(statistic)1.设X1,X2,Xn是从总体X
2、中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量l样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数3.统计量是统计推断的基础6.1.2 常用统计量样本均值样本均值样本方差样本方差样本变异系数样本变异系数样本样本k k 阶矩阶矩 样本样本k k 阶中心矩阶中心矩样本偏度样本偏度样本峰度样本峰度掌握掌握一般一般了解了解6.1.3 次序统计量一组样本观测值X1,X2,Xn由小到大的排序 X(1)X(2)X(i)X(n)后,称X(1),X(2),X(n)为次序统计量 中位数、分位数、四分位数等
3、都是次序统计量6.1.4 充分统计量统计量加工过程中一点信息都不损失的统计量称为充分统计量。当X(X1,X2,Xn)是来自正态分布总体N(,2)的一个样本时,若已知,则 是 2 的充分统计量;若 2已知,则 是 的充分统计量。方差均值6.2 关于分布的几个概念6.2.1 抽样分布抽样分布6.2.2 渐进分布渐进分布6.2.3 随机模拟获得的近似分布随机模拟获得的近似分布 为什么要抽样?为什么要抽样?为了收集必要的资料,对所研究对象(总体)的全部元为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。素逐一进行观测,往往不很现实。抽抽样样原原因因元素多,搜集数据费元素多,
4、搜集数据费时、费用大,不及时而时、费用大,不及时而使所得的数据无意义使所得的数据无意义总体庞大总体庞大,难以对总难以对总体的全部元素进行体的全部元素进行研究研究检查具有破坏性检查具有破坏性炮弹、灯管、砖等炮弹、灯管、砖等关于总体,知道得很少关于总体,知道得很少所有数据所有数据何种分布何种分布样本数据样本数据已知已知总体特征总体特征总体特征总体特征想知道想知道描述性统计,计算参数描述性统计,计算参数统计推断统计推断为什么能抽样?为什么能抽样?中国成语:“一叶知秋”出自淮南子说山训:“以小明大,见一叶落而知岁之将暮,睹瓶中之冰而知天下之寒。”谚语:“你不必吃完整头牛,才知道肉是老的”从检查一部分得
5、知全体。复习 抽样方法简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样系统抽样系统抽样多阶段抽样多阶段抽样概率抽样概率抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样配额抽样配额抽样非概率抽样非概率抽样抽样方式抽样方式1.样本统计量的概率分布,是一种理论分布l在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是 样本统计量样本统计量l样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 6.2.1 抽样分布(sampl
6、ing distribution)抽样分布的形成过程 (sampling distribution)总体总体计算样本统计计算样本统计量量如:样本均值、比例、方差样样本本当样本量n无限增大时,计算统计量T(X1,X2,Xn)的极限分布,把极限分布作为抽样分布的一种近似,这种极限分布就被称为渐近分布。6.2.2 渐近分布6.2.3 随机模拟获得的近似分布 随机模拟:大样本时,样本均值服从正态分布吗随机模拟:大样本时,样本均值服从正态分布吗?提示:提示:EXCEL数据分析数据分析随机数发生器随机数发生器思考思考几几种种概概率率分分布布正态分布正态分布 分布分布 F F 分布分布 t t 分布分布6.
7、3 由正态分布导出的几个重要分布6.3.1 2分布 (2 distribution)n 设 随 机 变 量 X1,X2,Xn相 互 独 立,且 ,则 服从自由度为n的 2分布。n当总体 ,从中抽取容量为n的样本,则n 由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来。&6.3.1 2分布 (2 distribution)2分布的概率密度函数1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:E(2)=n,方差为:D(2)=2n
8、(n为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 5.n时,2分布的极限分布是正态分布。2分布 (性质和特点)c2分布(图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20例题设随机变量 ,求 中的 。解:,查表:即临界值6.3.2 t 分布(t distribution)高 塞 特(W.S.Gosset)于 1908年 在 一 篇 以“Student”(学生)为笔名的论文中首
9、次提出。设随机变量 ,且X与Y独立,则 ,称为t分布,记为t(n),n为自由度。6.3.2 t 分布 (t distribution)t 分布的概率密度函数t 分布数学期望与方差n2时,t 分布期望为:E(t)=0,n3时,t 分布方差为:D(t)=n/n-2(n为自由度)t 分布图示x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布分布分布标准正态标准正态分布分布t t不同自由度的不同自由度的不同自由度的不同自由度的t t分布分布分布分布标准正态分布标准正态分布标准正态分布标准正态分布t t(dfdf=13)=1
10、3)t t(dfdf=5)=5)z z t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 例题1.由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名2.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为6.3.3 F分布(F distribution)F分布的概率密度函数为分布的概率密度函数为:6.3.3 F分布(F distribution)XF(m,n),则 n2时
11、,期望为:E(X)=n/n-2 n4时,方差为:F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)6.3.3 F分布(F distribution)F分布与t 分布关系 如果随机变量Xt(n),则 X2F(1,n)。例题6.4 样本均值的分布与中心极限定理 样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础样本均值的抽样分布(例题分析)【例例】设设一一个个总总体体含含有有4 个个个个体体,分分别别为为X1=1、X2=2、X3=3、X4=4。总体的均值、方
12、差及分布如下。总体的均值、方差及分布如下。总体均值和方差总体均值和方差总体的频数分布总体的频数分布1 14 42 23 30 0.1.1.2.2.3.3样本均值的抽样分布 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2 的样本(共16个)样本均值的抽样分布 各样本的均值如下表,并给出样本均值的抽样分布各样本的均值如下表,并给出样本均值的抽样分布x x样本均值的抽样分布样本均值的抽样分布1.01.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 及其 抽样 分布
限制150内