统计学4.总体分布、参数估计.ppt
《统计学4.总体分布、参数估计.ppt》由会员分享,可在线阅读,更多相关《统计学4.总体分布、参数估计.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 总体分布、总体分布、样本分布与参数估计样本分布与参数估计 4.1 总体分布与样本分布总体分布与样本分布一、一、总体总体(母体)(母体):反映总体特征的随机变量的取值的全体。反映总体特征的随机变量的取值的全体。总体分布总体分布(母体分布):反映总体特征的随机变量的概率分(母体分布):反映总体特征的随机变量的概率分布。布。从无限次随机抽取(然后放回)的角度看,表征一个总体从无限次随机抽取(然后放回)的角度看,表征一个总体特征的变量(指标),都可以视为随机变量。特征的变量(指标),都可以视为随机变量。有限总体的概率分布,就是有限总体中不同个体的比率有限总体的概率分布,就是有限总体中不同
2、个体的比率(频率)分布。(频率)分布。二、随机样本与样本观测值(样本数据)二、随机样本与样本观测值(样本数据)1、随机样本、随机样本 表征表征n次抽取个体的随机抽样的一组随机变量次抽取个体的随机抽样的一组随机变量X1,X2,Xn。2、样本观测值、样本观测值 n次随机抽样的结果:次随机抽样的结果:x1,x2,xn(称为随机样本称为随机样本X1,X2,Xn 的的样本观测值样本观测值)。)。n称为随机样本向量(称为随机样本向量(X1,X2,Xn)的维度,即自由的维度,即自由度。度。3、样本(累积)分布函数、样本(累积)分布函数 设样本观测值设样本观测值x1 x2 ,xn ki为为小于小于xi+1的样
3、本的样本值出现的累积频次值出现的累积频次,n为样本容量为样本容量,则可得样本累积频率分则可得样本累积频率分布函数如下布函数如下:样本累积频率分布函数样本累积频率分布函数,又称样本又称样本(累积累积)分布函数分布函数.样本样本(累累积积)分布函数分布函数Fn(x)是对总体的累积分布函数是对总体的累积分布函数F(x)的近似的近似,n越大越大,Fn(x)对对F(x)的近似越好的近似越好.样本分布与总体分布样本分布与总体分布格利文科格利文科(Glivenko)定理定理 (样本分布与总体分布的关系样本分布与总体分布的关系)定理定理:当样本容量当样本容量 n 趋于无穷大时趋于无穷大时,Fn(x)以概率以概
4、率1(关于关于 x)均均匀地收敛于匀地收敛于F(x).该定理是该定理是运用样本推断总体的理论依据运用样本推断总体的理论依据.定理的数学表达为定理的数学表达为:随机样本的均值函数和方差函数都是一个随机变量随机样本的均值函数和方差函数都是一个随机变量.样本数据的样本均值样本数据的样本均值 x 是随机变量是随机变量 X 的观测值;样本数据的观测值;样本数据的样本方差的样本方差 s2 是随机变量是随机变量 S2 的观测值的观测值.随机样本的均值函数:随机样本的均值函数:随机样本的方差函数随机样本的方差函数:三、统计量与统计量的分布三、统计量与统计量的分布统计量定义:统计量是不含未知参数的,随机样本统计
5、量定义:统计量是不含未知参数的,随机样本X1,X2,,Xn的函数。的函数。统计量的值的定义统计量的值的定义:统计量的值是不含未知参数的统计量的值是不含未知参数的,样本样本观测值观测值x1,x2,xn的函数的函数.四、由标准正态分布四、由标准正态分布 N(0,1)的随机样本所引出的几的随机样本所引出的几个重要统计量分布:个重要统计量分布:2、t 与与 F分布分布 1、2(n)分布的构成分布的构成 设随机变量设随机变量 X 服从服从N(0,1)分布,分布,X1,X2,,Xn为为 X 样本,则样本,则 2=X2i=X21+X22+X2n 服从自由度为服从自由度为n的的 2 分布,记为分布,记为 2
6、2(n)。)。2(n)分布的均值分布的均值 E(2)=n,方差方差 D(2)=2n。n=1n=4n=10 2(n)分布图分布图 2(n)密度函数:密度函数:其中,其中,n为自由度。为自由度。(n/2)为珈玛函数,是一个含参数为珈玛函数,是一个含参数n/2的积分,为:的积分,为:2、t 分布分布自由度为自由度为n的的t 分布,记为分布,记为 t(n),),是由是由N(0,1)分布和分布和 2(n)分布组成的,其表达式为:分布组成的,其表达式为:其中,其中,X 服从服从 N(0,1),),Y 服从服从 2(n)分布,且分布,且X与与Y相互独立。相互独立。密度函数为:密度函数为:t 分布图分布图3、
7、F 分布分布F 分布是由两个分布是由两个 2 分布之比组成的:分布之比组成的:服从服从F(m,n)。)。其中,其中,U 服从服从 2(m),),V 服从服从 2(n)。)。m=100,n=20m=15,n=20重要性质:重要性质:密度函数形式为:密度函数形式为:五、由一般正态分布的随机样本所构成的若干重要统计量五、由一般正态分布的随机样本所构成的若干重要统计量 的分布的分布定理:若定理:若X1,X2,,Xn 是是正态总体正态总体N(,2)的的一个一个随机样本,则样本均值函数和样本方差函数,满足如下性随机样本,则样本均值函数和样本方差函数,满足如下性质:质:(1)X 服从服从N(,2/n)分布。
8、分布。(2)X 与与 S2 相互独立。相互独立。(3)服从服从N(0,1)分布;分布;(4)服从服从 2(n-1)分布;分布;(5)服从服从t(n-1)分布;分布;(1)服从服从N(0,1)。)。(6)服从服从 2(n)分布;分布;定理:若定理:若X1,X2,,Xn1 和和Y1,Y2,,Yn2 分别是正态分别是正态总体总体N(1,12)和和N(2,22)的一个随机样本,且的一个随机样本,且它们相互独立,则满足如下性质:它们相互独立,则满足如下性质:(3)服从服从F(n1-1,n2-1)。)。其中,其中,S12是容量为是容量为n1的的X的样本方差,的样本方差,S22是容量为是容量为n2 的的Y的
9、样本方差。的样本方差。(2)服从服从t(n1+n2-2),(),(1=2)。)。(4)服从服从F(n1,n2)。)。六、任意分布的随机样本均值函数的均值与方差六、任意分布的随机样本均值函数的均值与方差设:随机变量设:随机变量 X 服从任何均值为服从任何均值为,标准差为,标准差为 的分布,的分布,X是随机样本是随机样本X1,X2,,Xn的均值函数。记随机变量的均值函数。记随机变量X的分布函数的均值为的分布函数的均值为 X,标准差为标准差为 X,则有如下结则有如下结论成立:论成立:(1)X=;(2)(2)X=/n 或或 2X=2/n 注注:一个应用广泛的样本均值函数的均值和方差一个应用广泛的样本均
10、值函数的均值和方差:0-1分布分布的样本均值函数均值和方差。的样本均值函数均值和方差。反映总体中某类个体的比例的随机变量反映总体中某类个体的比例的随机变量X,可以简单地可以简单地用用0-1分布分布B(1,p)表示表示.E(X)=p,D(X)=p(1-p).p 是总体中是总体中某类个体的比例某类个体的比例.由样本由样本X1,X2,,Xn产生均值函数产生均值函数X的均值的均值 X=p,方差方差 的均值也是总体中某类个体的比例的均值也是总体中某类个体的比例 p.所以所以,常用常用 x 来估计来估计p.七、大样本均值函数的分布:中心极限定理七、大样本均值函数的分布:中心极限定理设:随机变量设:随机变量
11、 X 服从任何均值为服从任何均值为,标准差为,标准差为 的分布,的分布,X是随机样本是随机样本X1,X2,,Xn的均值函数。的均值函数。中心极限定理:当中心极限定理:当 n 充分大时,充分大时,X 近似地服从均值为近似地服从均值为,标准差为标准差为 /n的正态分布。的正态分布。在在 实际问题中实际问题中n多大?但一般多大?但一般 n 30。对于一个学生而言对于一个学生而言,来参加家长会的家长来参加家长会的家长人数是一个随机变量人数是一个随机变量.设一个学生无家长、设一个学生无家长、1名名家长、家长、2名家长来参加会议的概率分别为名家长来参加会议的概率分别为0.05、0.8、0.15.若学校共有
12、若学校共有400名学生名学生,设各学生参加设各学生参加会议的家长数相互独立会议的家长数相互独立,且服从同一分布且服从同一分布.(1)求参加会议的家长数求参加会议的家长数X超过超过450的概率的概率;(2)求有求有1名家长来参加会议的学生数不多于名家长来参加会议的学生数不多于340的概率的概率.解解中心极限定理例题解析中心极限定理例题解析根据根据中心极限定理中心极限定理中心极限定理可得:中心极限定理可得:对比总体参数和样本统计量 4.2 点估计点估计在实际问题中,人们常常判断总体分布的参数,这就需要在实际问题中,人们常常判断总体分布的参数,这就需要用样本来推断总体分布的这些参数,这就是参数估计。
13、用样本来推断总体分布的这些参数,这就是参数估计。参数估计分为:参数估计分为:点估计点估计和和区间估计区间估计两种方法。两种方法。1、点估计概念、点估计概念 设设 是总体分布中一个需要估计的参数,现从总体中抽是总体分布中一个需要估计的参数,现从总体中抽取一个随机样本取一个随机样本X1,X2,,Xn,记记估计估计 的统计量为的统计量为 则则称称 为为 的估计量。的估计量。若若得到一组样本观测值得到一组样本观测值x1,x2,xn,就可就可得出得出 的估计的估计值,记:值,记:。注注:在选取样本统计量:在选取样本统计量 作为点估计时,必须考虑到作为点估计时,必须考虑到“无无偏差偏差 性性”,这一点很重
14、要。,这一点很重要。如果样本统计量的期望值(或均值)与打算估计的总体参如果样本统计量的期望值(或均值)与打算估计的总体参数值相同,则估计值不存在偏差。数值相同,则估计值不存在偏差。总体分布参数总体分布参数 的点估计,就是求出的点估计,就是求出 的估计值的估计值 。对比总体参数和样本统计量 点点估计估计 2、矩法估计、矩法估计 就是用样本矩来估计总体矩。就是用样本矩来估计总体矩。矩的一般形式:矩的一般形式:E(X k)表示表示 k 阶原点矩(以原点为中心);阶原点矩(以原点为中心);E(X-)k 表示表示k 阶中心矩(以阶中心矩(以 为中心);为中心);3、极大似然估计法、极大似然估计法设:总体
15、设:总体 X 的(累积)概率分布函数为的(累积)概率分布函数为F(x,),概率密概率密度函数度函数 f(x,),其中其中 为未知参数为未知参数(也可以表示未知参数也可以表示未知参数向量向量).若若 X 为离散型随机变量为离散型随机变量,则由离散型与连续型的对则由离散型与连续型的对应关系应关系,f(x,)对应于离散情况下的概率对应于离散情况下的概率P(X=x).X 为连续型随机变量时为连续型随机变量时,X的随机样本的随机样本X1,X2,,Xn的联的联合概率密度函数为合概率密度函数为 称为称为 的极大似然估计函数的极大似然估计函数.当当 X 为离散随机变量时为离散随机变量时,L表示概率表示概率:L
16、关于关于 的极大值如果存在的极大值如果存在,极大值极大值 就就是是 的极大似然估计值的极大似然估计值.其含义是其含义是:一组观测值一组观测值x1,x2,xn在一次实验中出现了在一次实验中出现了,其联合概率就应当是最大的其联合概率就应当是最大的,所所以选择使联合密度以选择使联合密度L最大的那个最大的那个 .例例:设设x1,x2,,xn是是正态总体正态总体N(,2)的一个样的一个样本观测值,求本观测值,求 与与 2 的极大似然估计值的极大似然估计值.解解:极大似然函数为极大似然函数为取取对数对数,分别对分别对 与与 2 求偏导求偏导,并令偏导为并令偏导为0,可求出可求出 与与 2的极大似然估计值如
17、下的极大似然估计值如下:如果将上述如果将上述xi 换成换成 Xi,上式成为极大似然估计量上式成为极大似然估计量.例例:设设X服从区间服从区间a,b上的均匀分布,上的均匀分布,a、b是求知参数,是求知参数,(x1,x2,,xn)是来自总体是来自总体X的样本,求的样本,求a、b的矩估的矩估计量计量解解:X的密度函数的密度函数 4.3 判别点估计的优劣标准判别点估计的优劣标准1、无偏估计量、无偏估计量如果如果 ,则称,则称 为为 的无偏估计量。的无偏估计量。2、最小方差性、最小方差性若总体参数为若总体参数为,的估计量的估计量 的方差的方差Var()小于等于小于等于其他所有对其他所有对 的估计量的估计
18、量 的方差,即的方差,即则称则称 的估计量的估计量 具有最小方差性。具有最小方差性。3、有效估计量、有效估计量 如果一个估计量满足如果一个估计量满足(1)无偏性;()无偏性;(2)最小方差性。)最小方差性。那么,该估计量为有效估计量那么,该估计量为有效估计量。4、渐近无偏估计量、渐近无偏估计量如果:如果:,(,(n为样本容量)则称为样本容量)则称 为渐近无为渐近无偏估计量。偏估计量。5、一致估计量、一致估计量如果如果 满足:满足:则称则称 为为 的一致估计量。的一致估计量。一致估计量的另一等价定义:一致估计量的另一等价定义:(1)渐进无偏的;渐进无偏的;(2)9、渐进有效性、渐进有效性如果一个
19、估计量满足:如果一个估计量满足:(1)是一致估计量;()是一致估计量;(2)比其)比其它的估计量更小的渐进方差。它的估计量更小的渐进方差。注:在实践中广泛应用的准则:注:在实践中广泛应用的准则:(1)小样本准则)小样本准则 a、无无偏性;偏性;b、有效性。有效性。(2)大样本准则)大样本准则 一致估计量。一致估计量。渐进方差定义:渐进方差定义:例例:设(设(x1,x2,,xn)是来自具有有限数学期望的任是来自具有有限数学期望的任一总体一总体X的一个样本,记的一个样本,记E(X)=a,证明:证明:是是a的无偏估计。的无偏估计。4.4 区间估计区间估计1、置信区间、置信区间若总体分布含有一个未知参
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 总体 分布 参数估计
限制150内