统计量及其抽样分布.ppt
《统计量及其抽样分布.ppt》由会员分享,可在线阅读,更多相关《统计量及其抽样分布.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 6 章 统计量及其抽样分布,第 6 章 统计量及其抽样分布,6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.6 两个样本平均值之差的分布 6.7 关于样本方差的分布,了解统计量及其分布的几个概念 了解由正态分布导出的几个重要分布 理解样本均值的分布与中心极限定理 掌握单样本比例和样本方差的抽样分布,学习目标,6.1 统计量,6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量 6.1.4 充分统计量,设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本
2、构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量 样本均值、样本比例、样本方差等都是统计量 统计量是样本的一个函数 统计量是统计推断的基础,统计量(statistic),一组样本观测值X1,X2,Xn由小到大的排序 X(1)X(2) X(i) X(n) 后,称X(1),X(2),X(n)为次序统计量 中位数、分位数、四分位数等都是次序统计量,次序统计量,6.2 关于分布的几个概念,6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布,样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可
3、能取值形成的相对频数分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),6.3 由正态分布导出的几个重要分布,6.3.1 2分布 6.3.2 t 分布 6.3.3 F 分布,2 分布,2 分布的使用,如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从2 分布 方差就可视为若干随机变量值的平方和 样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方差之比,服从自由度为n-1的2 分布
4、,由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来 设 ,则 令 ,则 Y 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则,2分布(2 distribution),分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布,2分布(性质和特点),c2分
5、布(图示),t 分布,t 分布,高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,t 分布图示,T分布的图形,T分布的使用,F 分布,F分布,两个都服从2 分布的变量之比的分布规律。 可以设想为两个方差之比 方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个),由统计学家费
6、希尔(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名 设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为,F分布(F distribution),F分布,两个都服从2 分布的变量之比的分布规律。 可以设想为两个方差之比 方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个),F分布(图示), 不同自由度的F分布,F分布的图形,此处的n和m分别相当于n1、n
7、2,F分布的使用,应用很广泛,可用来检验两状态总体方差是否相等,检验回归方差是否有代表性,在方差分析和多元统计中都是重要的检验手段。,三种抽样分布的对比,2 分布可视为关于方差的分布规律。 t 分布中的两个变量,一个服从正态分布,另一个服从2 分布。可视为均值与方差之比的分布规律。 F分布的变量都服从2 分布,可以设想为两个方差之比的分布规律。 这些“分布”都说明变量的规律,某些具有相同特征的变量具有什么样的共同规律。现实中,按图索骥,依样画葫芦。,三种抽样分布综述,为什么要使用统计方法?因为要了解事物的数量特征,几乎惟一的方法是抽样,随机抽样,抽样可以有很多结果,众结果的随机性规律是正态分布
8、,为什么要导出三大抽样分布?因为要了解的数量特征 的性质不同,比如,可能要了解样本方差的规律,若干个变量都服从正态分布,每变量有不同取值,计算 每组取值中各值的平方,再加起来,该总和服从2 分布,每次抽样的误差与平均误差之比服从t分布,两个样本的方差之比服从F分布,什么是分布?骰子点数服从均匀分布,身高服从正态分布。 分布就是各种情况发生概率的全体组合。,6.4 样本均值的分布与中心极限定理,抽样分布,抽样分布 从总体种抽出容量相同的样本,计算统计量的值,然后按统计量的值所编制的频数分布。 抽样分布的作用: 根据抽样分布研究统计量的性质 对统计推断方法进行评价,抽样分布:样本统计量所有可能值的
9、概率分布。,样本统计量,总体未知参数,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,样本统计量,分布的形状及接近总体参数的程度,STAT,知道这些“分布”有什么用? 从现象上看,事物非常复杂,但其中某些内容具有某种意义上的相同性质(比如7条鱼与7天之间都有7这个数量) 从逻辑上看,可以在某些限定条件下构造许多模型,即数量关系(此处都用“等于”关系),这些关系的总和都符合逻辑,现实中事物如果符合那些限定条件,则其本角度的其他特征(可视为进一步的发展结果)都会服从逻辑模型所表述的变化规律 统计分布类型就是:在某些
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 及其 抽样 分布 散布
限制150内