高等统计3.pdf
《高等统计3.pdf》由会员分享,可在线阅读,更多相关《高等统计3.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2 充分统计量与完备统计量充分统计量与完备统计量 对样本进行加工,将样本中分散的信息浓缩集中起来。因对样本进行加工,将样本中分散的信息浓缩集中起来。因为样本包含了总体的分布信息,而样本是为样本包含了总体的分布信息,而样本是 n 维的,这些信息维的,这些信息是分散到样本的每个分量上的,因此直接从样本出发来推断是分散到样本的每个分量上的,因此直接从样本出发来推断总体是不方便的,由此引发出统计量。总体是不方便的,由此引发出统计量。统计量:通常称样本统计量:通常称样本n21X,X,XL的函数的函数 g(n21X,X,XL)为统为统计量,这里计量,这里 g 是完全已知的函数,一旦样本是完全已知的函数
2、,一旦样本n21X,X,XL的值的值取定,统计量的值就可以算出来。取定,统计量的值就可以算出来。注:为了进行严密的数学研究,通常假定注:为了进行严密的数学研究,通常假定 g 是是 Borel 可测函可测函数。数。例例 设某个总体设某个总体 X 的分布具有均值的分布具有均值,方差,方差2,n21X,X,XL为取自该总体的样本。则此样本的每个分量为取自该总体的样本。则此样本的每个分量iX的分布的均值为的分布的均值为,方差为,方差为2。则。则iX与与的分散程度可用的分散程度可用2来衡量。来衡量。2越小,则越小,则iX与与的集中程度越高;反之,的集中程度越高;反之,2越越大,则大,则iX与与集中程度越
3、低。因此可认为每个集中程度越低。因此可认为每个iX都包含了都包含了关于总体均值的信息,而关于总体均值的信息,而2的大小反映了包含信息的多少:的大小反映了包含信息的多少:2越大,则越大,则iX包含信息越多;反之包含信息越多;反之2越小,则越小,则iX包含包含信息越少。现构造样本均值信息越少。现构造样本均值X这一统计量,这一统计量,X的分布的均值的分布的均值为为,方差为,方差为n/2。因此。因此X中包含中包含关于关于的信息的信息(用(用2n度度量量)远远多于任)远远多于任一分量。这一分量。这正正是将样本中是将样本中所所有有关于关于的信的信息息都都集中起来的集中起来的缘故缘故,不,不仅如仅如此,此,
4、X中包含样本中中包含样本中所所有有关于关于的信息与的信息与 n 成正比。这是因为样本容量越大时,样本中所成正比。这是因为样本容量越大时,样本中所包含关于包含关于的信息越多。为了估计样本均值,人们把样本加的信息越多。为了估计样本均值,人们把样本加工成样本均值,这种加工本质上是统计量压缩数据功能的体工成样本均值,这种加工本质上是统计量压缩数据功能的体现。直观上看,样本的不同的观察值,统计量现。直观上看,样本的不同的观察值,统计量 T=X有有相同相同的值。的值。譬如譬如,改变改变样本样本观察观察的的排列顺序排列顺序,不,不会改变会改变 T 的值,的值,这就是统计量这就是统计量“压“压缩数缩数据”据”
5、的的功能功能。一一、充分统计量充分统计量 我们要用我们要用样本推断总体分布的样本推断总体分布的未未知知参参数,为此来数,为此来构造适构造适当当的统计量。的统计量。显然显然,一个,一个“好”“好”的统计量的统计量应应该该能够把能够把样本中样本中所所包含的包含的关于未关于未知知参参数的信息全数的信息全部部集中起来。集中起来。如何如何将这样一将这样一个直个直观观的的想法用想法用严严格格的数学的数学形式表示呢?英国著名形式表示呢?英国著名的统计的统计学学家家 R.A.Fisher 在在 20 世纪提世纪提出了一个出了一个重要重要的的概念概念:充分统:充分统计量。计量。我们先我们先给给出定出定义义,然然
6、后再后再来来解释它解释它的含的含义义。定定义义:设:设 T=T(n21X,X,XL)为一个为一个一维一维或或多多维的维的统计量,统计量,给给定定 T 时时,样本,样本(n21X,X,XL)的的条件条件分布与分布与无无关关,则称,则称 T为为关于关于的充分统计量。的充分统计量。充分统计量的含充分统计量的含义义可以这样来可以这样来解释解释:样本中包含:样本中包含关于关于总总体分布中体分布中未未知知参参数数的信息,是因为样本分布与的信息,是因为样本分布与有有关关。对。对于于统计量统计量 T,如如果果我们我们已已经经知知道它道它的值以的值以后后,样本分布与,样本分布与无无关关,这就,这就意味着意味着样
7、本的样本的其余其余部部分不分不再再包含包含关于关于的信息。的信息。换换言言之之,在在 T 中包含了中包含了关于关于的全的全部部信息,因此信息,因此要要作作出出关于关于的统计推断的统计推断只需只需从从 T 出发出发即即可。这就是可。这就是“充分统计量充分统计量”这个这个词的含义。为了进一步说明这个道理,我们先看一个例子。词的含义。为了进一步说明这个道理,我们先看一个例子。例:设例:设n21X,X,XL是来自两点分布是来自两点分布 B(1,)的样本,即的样本,即=1)0X(P,)1X(Pii,且,且=n1iiXT,下面说明,下面说明 T 是是的充分统计量。的充分统计量。=txC1)1(C)1()t
8、T(P)tT,xX,xX,xX(P)tTxX,xX,xX(Pitntnttntntnn2211nn2211LL 因此因此 T 是是的充分统计量。的充分统计量。进一进一步步,我们我们利利用用 T=t,设计一个,设计一个随机试验随机试验,使其产生使其产生与与样 本样 本X=(n21X,X,XL)有有 相 同相 同 分 布 的分 布 的 新新 样 本样 本)X,X,X(Xn21=L。定。定义随机试验义随机试验:把把 t 个个 1 和和 n-t 个个 0随机随机排列排列,任任一个这样的一个这样的排列排列出出现都现都是是等等可可能能的。的。若记若记ix为为第第 i 个个位置位置上的数,则上的数,则ix非
9、非 0 即即 1,这样,这样得得到的到的)x,x,x(n21L是是新新样本样本)X,X,X(Xn21=L的的观察观察值。这个值。这个新新样本样本X虽虽然然不不能能与与旧旧样本完全样本完全相同相同,但但是是X与与在在条条件件 T=t 下下 X 的的条件条件概概率率是是相同相同的,的,都都等等于于1tn)C(,故故)xX,xX,xX(PC1)tTxX,xX,xX(Pnn2211tnnn2211=LL 由由于我们所于我们所设计的设计的随机试验随机试验是是在在已知已知 T的的条件下条件下,不含,不含任何任何信息,信息,所所以以旧旧样本样本所所含含的信息全的信息全部在部在统计量统计量 T 中。中。例:设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高等 统计
限制150内