概率统计中的反例.pdf
概率统计中的反例 前言 第一章 随机事件及其概率 1 同一问题的概型未必唯一 2 事件间的关系(1)由CBA=推不出 CBA=(2)由CBA=推不出CBA=(3)CBACBA)()(U 3 概率为零的事件未必是不可能的事件 4 由概率关系推不出事件间关系 5 试验次数多概率就一定大吗?6 概率与抽样方式是否有关 7 事件概率与试验的先后次序是否有关 第二章 随机变量极其分布 1 离散型分布的最可能值是否唯一 2 单调不降右连续是分布函数的必要而非充分条件 3 既非离散型又非连续型的分布函数是否存在 4 具有无记忆性的离散型分布是否存在 5 不几乎相等的随机变量是否有相同的分布 6 联合分布与其边缘分布未必是同类型分布 7 边缘分布不能决定联合分布 8 不同的联合分布可具有相同的边缘分布 9 正态边缘分布可由非正态联合分布导出 10.均匀分布不具有可加性 11.分布函数之和不是分布函数 第三章 独立性与相关性相容性 1 两两独立但不相互独立 2 P(ABC)=P(A)P(B)P(C)成立,但 A,B,C 不两两独立 3 独立关系不具有传递性 4 随机变量不独立,但其函数可以独立 5 X 与 Y 不独立,但2X与2Y独立 6 X 与 Y 不独立,但有相同分布 7 既不相关也不独立的随机变量 8 随机变量独立但它们的函数未必独立 9 独立性与相容性 10.独立同分布的随机变量是否必相等 11.有函数关系的随机变量是否一定不独立 第四章 随机变量的数字特征 1 随机变量的数学期望未必都存在 2 随机变量的方差未必都存在 3 数学期望存在但方差不存在 4 X 的函数的期望是否等于 X 的期望的函数 5 X 的各阶矩都存在也不能确定 X 的分布函数 6 满足 E(XY)=E(X)E(Y)的 X,Y 未必独立 第五章 参数估计与假设检验 1 矩估计是否有唯一性 2 矩估计不具有“不变性”3 极大似然估计是否有唯一性 4 似然方程的解未必是极大似然估计 5 参数估计的无偏性与一致性有无关系 6 无偏估计是否唯一 7 零假设与备择假设是否处于对等的地位 前 言 数学是由两个大类证明和反例组成 数学发现主要是提出证明和构造反例 从科学性来讲 反例就是推翻错误命题的有效手段 从教学上而言 反例能够加深对正确结论的全面理解 【美】B.R.盖尔鲍姆曾说 “一个数学问题用一个反例予以解决 给人的刺激犹如一出好的戏剧”相信读了概率统计中的反例后 我们大家都会有这一同感 第一章 随机事件及其概率 1 同一问题的概型未必唯一 概型(Schema)是随机现象的数学形式,它不是实际本身,而是实际的数学抽象。对于现实世界中的随机现象,要想进入数学理论的研究,首先必须确定其概型。由于我们的认识水平以及现实问题的复杂性,使得所选定的概型往往不是唯一的。概率论中著名的“n 个球在 n 个盒子中的分布问题”(见王梓坤概率论基础及其应用P12-13 科学出版社)就说明了这一情况,这是一个典型概型的问题,内容是:设有 r 个球,每个都能以相同概率 1/n 落到 n 个盒子(n=r)的每一个盒子中,求指定的某 r 个盒子中各有一个球的概率。如果我们把 r 各球视作 r 个人,而把 n 个盒子视为一年的天数:n=365.这时上述问题就成为了概率论中一个颇为著名问题的概型。此问题是求参加某次集会的几个人中,没有 n 个人生日相同的概率。众所周知,关于球彼此间可以认为是有区别,也可以认为无区别;一个盒子可以假定仅能容纳一个球,也可以允许它能容纳许多球,如此一来,就可以分为以下几种概型:(1)马克斯威尔波尔茨曼 认为球彼此之间有区别,且对每盒中可容纳球数不加限制;(2)玻色爱因斯坦 认为球彼此不能区别,且对每盒中可容纳球数不加限制;(3)费密狄雷克 认为球彼此无区别,且限制每盒中不能同时容纳二个球。后来,为了统一以上三种情况,又产生了第四种情况(4)布里龙 认为球彼此可以区别,且增加了一些其他条件限制(见杨宗磐概率论入门 P.13 科学出版社)以上四种情况,形成了统计物理学中的四种统计:球可看作为质点,盒子看作状态。再看一例:n 个人围成一个圆周,求其中甲、乙两人之间恰有 r(n-2)个人的概率。(圆周排列时,仅考虑从甲到乙的顺时针方向)对此问题,至少可找到三种概型来处理即可以构造如下的三种随机试验:(1)n 个人的任意一种排列作为一个基本事件;(2)仅以甲、乙两人在 n 个人一行中的不同排法作为基本事件组;(3)可由甲与乙之间的间隔数来考虑。不论取何种概型,本题的求概率均为 1/(n-1).2 事件间的关系(1).由CBA=推不出 CBA=事实上,令 A=1,2,3,4,B=1,3,5,于是 C=A-B=2,4,而ACB=5,4,3,2,1 注:但BA 时,能由CBACBA=(2).由CBA=推不出CBA=令 A=1,2,3,5,B=1,2,C=1,3,5,则CBA=但CBA=5,3 注:当AB,AC,且=BC时可由CBACBA=(3).一般CBACBA)()(令 A=1,2,B=2,3,C=2,则CBACBA=)(3,13,2,1)(注:当=AC 时,CBACBA=)()(3 概率为零的事件未必是不可能事件 不可能事件的概率必为零,反之却未必成立 当考虑的概型为古典概型时,概型为零的事件一定是不可能事件 当考虑的概型是几何概型时,概型为零的事件未必是一个不可能事件。例如:设试验 E 为“随机地向边长为 1 的正方形内投点”,事件 A 为“点投在正方形的一条对角线上”(见图)X Y 1 1 B O 此时1,0|),(=yxyx 1,0|=yxyxA 尽管010)(正方形的面积的面积线段EOBAP=但A却可能发生,另外,对于连续性随机变量,它在某固定点取值的概率为零,但它不是不可能发生。发生上述情形的原因,在于概率是一个测度,有测度为0的不可数集存在,并且对于连续函数来说,在一点处的积分为零。由对立事件知,概率为1的事件未必是必然事件。4 由概率关系推不出事件间关系 概率中有这样的性质:若事件A,B有关系BA,则其相应的概率关系是)()(BPAP,反之却不真。例如:设P(A)=0.1,P(B)=0.2,2.0)(=BAP,此时BA不 成立,事实 上,由)()()()(ABPBPAPBAP+=得出P(AB)=0.1.于是 0)()()(=ABPAPABAP 由问题3,这意味着可有ABA,从而未必有BA。5 试验次数多概率就一定大吗 在概率论的萌芽时期,有一个著名的(Chevalier de Were)问题:一颗骰子掷4次至少得一个1点,与两颗骰子掷24次至少得两个1点,这两个事件究竟哪个概率大?曾引起很多人的注意。现在看来,利用独立试验概型容易求出它们的概率。n次独立重复试验中事件A至少发生一次的概率为np)1(1,其中)(APp=,现考虑欲使21)1(1np,则)1lg(2lgpn,此式给出了n的下界,使问题得以解决。以掷一颗骰子作试验,要连续掷n次使1点至少出现一次的概率大于等于1/2,则8.3n.以掷两颗骰子作试验,要连续掷n次使两个1点至少出现一次的概率大于等于1/2,则6.24n.由此得出,一颗骰子掷4次至少有一个1点的概率大于等于1/2,而两颗骰子掷24次至少有一次得两个1点的概率小于1/2.本例说明试验次数很多,但概率不一定大。6 概率与抽样方式是否有关 一般,所求事件的概率与抽样方式有关,常见的有放回抽样与不放回抽样两种。前者指同一个体可被重复抽取,后者指已被抽取的个体不再参与下一此抽样,每一个体至多被抽到一次。例如有n件产品,其中有m件次品,现随机抽取l件产品。求其中恰有k件次品的概率。在抽样方式未定的情况下,此概率是不唯一的,事实上:若取放回抽样,所求概率klkklnmnmCp=)1()(1 (1)若取不放回抽样 所求概率lnklmnkmCCCp=2 (2)显然 21pp ),min(,2,1,0lmkL=(1),(2)分别称为二项分布与超几何分布。当n时)1()2(即二项分布是超几何分布的极限分布。由此得出如下结论:对于样本点个数较小的总体,在放回抽样与不放回抽样的场合,事件的概率会有较大的差别。当总体中样本点个数很大,样本容量不大时,这两种抽样方式对所求事件的概率实际上影响不大。7 事件概率与试验的先后次序是否有关 设有一口袋,内有a只黑球,b只白球,他们除颜色不同外没有其它不同之处,现把球一只只地摸出,求第k次摸出的是黑球的概率)1(bak+.初看题目,很可能会认为所求概率与摸球次序有关,若那样的话,体育比赛中先后抽签者中签的机会就不均等了,这与我们日常生活中的经验不符,通过具体计算亦可看出所求概率与摸球次序无关。按自然顺序给球编号,不妨先给黑球编号,再给白球编号,取样空间为第k次摸出的球的全部可能的结果,则,21ba+=L i表示第k次摸出第I号球,bai+=,2,1L,于是要求的是事件,21aAL=的概率。由古典概率baaAP+=)(,P(A)显然与k有关。本题可用多种方法求解,这里介绍的是最简单的一种,本题存在多种解法的原因,在于一个随机现象有时可用不同的样本空间来描述,所以称本解法是最简单的,因为解法中的样本空间是最小的。第二章 随机变量及其分布 1 离散型分布的最可能值是否唯一 离散型分布的最可能值指的是该随机变量取值中那些使概率达到最大的值,即若任意一个离散型分布LLLLnnpppxxx2121,若),sup(21LLnkpppp=,则称kx为此分布的最可能值。一般离散型分布的最可能值不唯一,比如:二项分布B(n,p)中,当pn)1(.+为非负整数时,恰有两个最可能值:pn)1(.+与1)1(+pn.如二项分布B(8,1/3),其最可能值为k=2或3.可以证明,任何离散型分布的最可能值一定存在,而且至少有一个。证明见王梓坤概率论基础及其应用 科学出版社)2 单调不降右连续是分布函数的必要条件 分布函数一定是单调不降(右)连续的函数,反之命题不成立。例如,取=1111211)(xxxxxF,)(xF显 然 是 调 调 不 降 函 数,且 右 连 续,可 是01)(=F,所以)(xF不可能是某个随机变量的分布函数。因为只有当一个函数满足单调不见,非负有界(1)(,0)(=+=FF,且右连续(或左连续)时,才能成为某个随机变量的分布函数。3 既非离散型又非连续型的分布函数是否存在 如果一个分布函数)(xF是连续的,并且其导函数几乎处处等于零(关于勒贝格测度而言),则称)(xF为奇异型分布函数。如果随机变量X的分布函数是奇异型的,则称X为奇异型随机变量。任何一个奇异型的分布函数都是一个既非离散型又非连续型的分布函数。有没有非奇异型的分布函数属于既非离散型又非连续型的分布函数?有,请看下例:设+=+则称概分布具有无记忆性。对于连续型分布来说,指数分布是唯一的具有无记忆性的。(证明可见 复旦大学概率论 人们教育出版社 P.125-126)在可靠性问题中,把X理解为某元件的寿命,则无记忆性表示某元件的寿命如果已知大于5年,则其寿命再延长七年的概率与年令无关。具有无记忆性的离散型分布也是存在且唯一的,那就是几何分布 L,2,1,)1()(1=kppkXPk 几何分布是一种等待分布,例如,在事件A发生的概率为p的贝努里试验之中,A首次出现时的等待次数X的分布为几何分布。5 不几乎相等的随机变量是否有相同的分布 若两个随机变量X,Y满足0)(=YXP,则称X与Y几乎相等。可以证明:几乎相等的随机变量具有相同的分布,反之都不成立。例如,设X与Y具有相同的分布 212111 并设X与Y相互独立,据此可算得121)(=YXP,从而021)(=YXP,即X与Y不几乎相等。所以不几乎相等得随机变量可以有相同的分布。6 联合分布与其边缘分布未必是同类型分布 我们知道二维正态分布的边缘分布仍为正态分布,多项分布的边缘分布亦为多项分布。那么联合分布与边缘分布是否都是为同类型分布呢?答案是否定的。例如二维均匀分布的边缘分布可以仍是均匀分布,也可以不是均匀分布。边与坐标轴平行的矩形域上的二维均匀分布的边缘分布仍是均匀分布,而圆域上的二维均匀分布的边缘分布不再是均匀分布。7 边缘分布不能决定联合分布 一般边缘分布由联合分布所决定,反之不真。例如:);,;,(),(222211NYX,则有),(211NX,),(222NY 反之,已知),(211NX,),(222NY,却得不出(X,Y)一定是二维正态分布的结论。若添加X与Y相互独立的条件,则可得)0;,;,(),(222211NYX 除连续型分布外,还可举出离散型分布的例子。8 不同的联合分布可具有相同的边缘分布 如下二个相异的联合分布:它们的边缘分布完全相同 Y 0 1 P 0.3 0.7 由此可见边缘分布由联合分布唯一决定,反之不成立,除离散型分布外,还可举出连续型分布的例子。9 正态边缘分布可由非正态联合分布导出 正态分布具有许多好的性质,其中之一是:二维正态分布的边缘分布仍是正态分布。反之,两边缘分布都是正态分布,起联合分布未必是正态分布,例如:设+=+yxyxeyxfYXyx,),sinsin1(21),(),(222 则+=+xedyyxfxfxX,21),()(22 +=+yedxyxfyfyY,21),()(22 即)1.0(NX,)1.0(NY,显然(X,Y)并不服从联合正态分布。10.均匀分布不具有可加性 若独立同分布的两随机变量之和仍服从原分布,则称该分布具有可加性。可以证明二项分布,泊松(Poisson)分布,正态分布均具有可加性,而均匀分布不具有这个性质。设X,Y相互独立,且都服从(a,b)上的均匀分布,令Z=X+Y,则Z的密度函数为:0 1 0 0.15 0.15 1 0.15 0.55 0 1 0 01 02 1 02 05 X 0 1 P 0.3 0.7 X Y X Y +1)维正态随机变量,可由坐标轴的旋转转变为一组几个独立的正态随机变量.(参见丁寿田译的前苏联概率论教程 P157)例 如n=2,即 使X,Y不 独 立,当(X,Y)服 从 二 维 正 态 分 布,令sincosYXZ+=,cossinYXW+=,则(Z,W)仍服从二维正态分布,其联合密度函数为:)2()1(21221222121),(CWBZWAZeWZf+=只要适当地选择:22212122=tg 则B=0,此时Z与W独立 5 X与Y不独立,但2X与2Y独立 若随机变量X与Y独立,则2X与2Y必相互独立,其逆不真 例如:设(X,Y)的联合密度函数为 +=其他01|,1|)1(41),(yxxyyxf =+=1110)41(00)()(1122xxxdudyuyxxXPxFxxX =111000)(2yyyyyFY =1,1110,1010,11,10000),(22yxyxxyyxyyxxyxyxFYX或 对于一切x,y恒有)()(),(2222yFxFyxFYXYX=所以2X与2Y相互独立。=其他01|21)(xxfX +=1011),(2222yxyxyxf 容易验证 不相关YXYEXEXYEYX,0)()()(),cov(=不独立YXyfxfyxfYX,)()(),(.8 随机变量独立但它们的函数未必独立 设).,(),(YXgWYXfZ=X,Y为相互独立的随机变量(1)Z,W独立的例子 设X,Y独立且有相同分布),0(2N,取22YXZ+=,YXW=,则(Z,W)的联合密度为=+000),()1(122222zzezwzfz 边缘密度为 =000)(2222zzezzfzZ BPAP,且A,B不能不相容,用反证法证明此命题。若=AB,则0)(=ABP,由A,B独 立,且0)(,0)(BPAP得0)()()(=BPAPABP,矛盾,因而AB 可见在题设条件下,A与B独立同A与B互不相容不能同时成立。但若A,B中有一个概率为0,则A与B独立同A与B互不相容可同时成立。10 独立同分布的随机变量是否必相等 设X,Y互相独立,且都服从两点分布 2/12/111 则未必有X=Y 事实上,由X,Y的独立性有 214141)1()1()1()1()1,1()1,1()(=+=+=+=YPXPYPXPYXPYXPYXP 显然X=Y不是必然事件.11 有函数关系的随机变量是否一定不独立 考验如下三个随机变量X,Y和Z:假定X与Y独立且都服从参数为p的(01)分布,令Z为X与Y的函数 +=为奇数为偶数YXYXZ10 由于X,Y独立,可得(X,Y)的联合分布律 0 1 0 2)1(p)1(pp 1)1(pp 2p Z的概率分布为:+222)1(10ppp(X,Z)的联合分布率为 0 1 Z的分布 0 2)1(p 2p 22)1(pp+1)1(pp)1(pp)1(2pp X的分布)1(p p 显然当P=1/2,Z与X相互独立 可见,尽管Z与X之间存在函数关系,但它们可以相互独立.第四章 随机变量的数字特征 1 随机变量的数学期望未必都存在 在数学期望的定义中,要求级数绝对收敛或积分绝对可积,我们知道,绝对收敛的级数一定收敛,绝对可积的函数一定可积。反之都不真,故有数学期望不存在的随机变量存在。(1)离散的例子 设随机变量X取值L,2,1,2)1(1=kkxkkk,相应的概率为L,2,1,21=kpkk 由于=111|kkkkkpx,所以X的数学期望不存在 然而2ln41312111)1(111=+=Lkpxkkkkk X Y X Z 若把上式左边级数中的各项进行重排,会收敛到不同的数 例如:2ln2341715121311=+L 2ln2181613141211=+L 一个随机变量的数学期望只能是一个数,因此数学期望定义中要求的绝对收敛是必要的,它们可以保证kx顺序的变化不影响数学期望中级数的收敛性(2)连续的例子,见教材P.141 例5 柯西(Cauchy)分布 2 随机变量的方差未必都存在 按定义 2)()(XEXEXD=,由于方差被定义为一种特殊形式(即随机变量X的函数)的数学期望,而随机变量及随机变量函数的数学期望都未必存在,所以随机变量的方差也未必存在。本章1中所举两例中的随机变量的方差都不存在.3 数学期望存在但方差不存在 参数为n的t分布的密度函数是 +=+xnxnnnxfnn,)1()2()21()(212 设随机变量)2(tX,则其密度函数 2322)21(42)(+=xxf +=0)()(2dxxxfXE 2X 的数学期望不存在,所以X的方差不存在 关于t分布,其矩有一个特点,当r2时,0)(=XE,2)()(2=nnXEXD,故在n=2时,=)(XD.4 X的函数的期望是否等于X的期望的函数 一般)()(XEfXfE 例如:设X服从如下分布:4/14/14/14/12101 再设2,1,0,1,)(3=xxxxf于是随机变量函数 4/14/360)(xf 故得23)(=XfE,由于2/1)(=XE,可得8321)21()(3=XEf,所以)()(XEfXfE 5 X的各阶矩都存在也不能确定X的分布函数 若已经X属于某个分布,且又知道其某些矩,便可确定X的分布函数,比如知道一阶原点矩(即数学期望)就能确定(01)分布的泊松分布,指数分布的分布函数,若进一步还知道二阶中心矩,便能确定二项分布,均匀分布,正态分布的分布函数。由此是否能推断:知道X的各阶矩,就一定能确定X的分布函数呢?回答是否定的,事实上,存在着不同的分布函数,其各阶矩都一样。例如 设随机变量X与Y的密度函数分别是 =000)(cosxxcexfaxXa +=000)cossin(1)(xxaxcxfaY 其中0a=xxexfx 用矩估计法分别对和2作估计 =02)()(dxxxfXE 2202202222)()(=dtetdxxfxXEt 设),(21nXXXL为取自反射正态总体的样本,由矩阵令 2212)(1,2)(=XEXnXEXnii 得:=niiXnX1221,2 由此可见 =niiXnX12212)(2 所以矩估计不满足不变性.3 极大的似然估计是否有唯一性 极大似然估计不具有唯一性,例如 设均匀分布的密度函数 为待估参数其他+=021211);()()1(nxxxf 似然函数:+=+=其他其他其他0212110212110)1(21211);();,()1()()()1(1xxxxnixxfxxLnniniinxL 显然区间21,21)1()(+xxn中的每一点均为)(L的最大值点 于是10 121)()1()(+=tXXtXnn,均为的极大似然估计量 注:当2121)1()(+=XXn时,的极大似然估计唯一 当2121)1()(+XXn时,的极大似然估计不存在.4 似然方程的解未必是极大似然估计 设),(21nXXXL是取自柯西(Cauchy)分布+=xxxf)(1 1);(2 的样本 当1=n时,似然函数为)(1 1)(21+=xL )(1lnln)(ln21+=xL 似然方程为 0)(1)(2ln211=+=xxL 故1X=是的极大似然估计量 当2=n时,似然函数为 ()1)(1)(1 1)(2221+=xxL 要使)(L达到最大,只要(1)的分母最小,令其分母的变量部分为 )(1)(1)(222+=xxfx 由 )2(0 1)()2(2)(2121221=+=xxxxxxf 得三个解:2/4)()(,2221213,2211+=+=XXXXXX 通过)(f 的正负可判得:当1为的极大似然估计时,3,2不是的极大似然估计;反之,当3,2为的极大似然估计时,1不是的极大似然估计。而无论发生什么情况,似然方程(2)的三个解不全是的极大似然估计 极大似然估计就是求似然函数的极大值点,似然函数是样本的联合分布密度,似然方程是似然函数的导函数为零的函数。我们知道,导函数为零的点是函数的驻点,而驻点未必是函数的极大值点,所以似然方程的解未必是极大似然估计.5 参数估计的无偏性与一致性有无关系 两者间没有一定的关系,下表中所列的四种情况均可以发生 无偏性 有偏性 一致性 非一致 以均匀分布为例 ),(21nXXXL为如下均为总体的一个样本 =其他001);(xxfX 由极大似然估计法可得)nX(的总体参数的一个极大似然估计,且唯一 )(nX的概率密度为,有 ()/=ndxdxxfXPx01);()|(|0|1 )(01);()|2(|220|2|1/=+=+ndxdxdxxfXPx由此得有偏估计1X和无偏估计12X都不是的一致估计.6 无偏估计是否唯一的 仅由估计量的数学期望等于被估计的参数这一要求并不能保证估计量的唯一性 例如:设),(21nXXXL是来自参数为的泊松分布的总体的一个简单随即样本,则 212211)(111XXnSXnXniinii=都是的无偏估计,事实上,由基本统计量的性质知 =)()()()()()(221XDSEEXEXEE 又如,设总体,0(UX的一个简单随机样本为),(21nXXXL,则的估计量,max122121nXXXnnXL+=与均 为的 无 偏 估 计,事 实 上,=+=ydyynnnEXEXEEnn01211)(22)(2)2()(其中,max21nXXXYL=,其密度函数为 HH 此 时 05.0,32.0,92.0,16=Sxn,由t检 验 法 可 知 拒 绝 域 为94.0753.11632.08.0)116(1632.08.005.0+=+tX,由于94.092.0)作为零假设,则得假设检验问题:8.0:;8.0:10HH 由t检验法,此时的拒绝域为66.0)116(1632.08.005.0=tX,因为观测值66.092.0=x,所以应接受零假设,即接受厂方断言的对立面 由此可见,随着问题提法的不同,得出了截然相反的结论,这一点会使初学者感到迷惑不解,实际上,这里有个着眼点不同的问题,当把“厂方断言正确”作为零假设时,我们根据该厂以往的表现和信誉,对其断言已有了较大的信任,只有很不利于它的观察结果才能改变我们的看法,因而一般难以拒绝这个断言,反之,当把“厂方断言不正确”作为零假设时,我们一开始就对该厂产品抱怀疑态度,只有很有利于该厂的观察结果,才能改变我们的看法,因此,在所得观察数据并非决定性地偏于一方时,我们的着眼点(即最初立场)决定了所得的结论 打一个通俗的比喻:某人是嫌疑犯,有些不利于他的证据,但并非是起决定性作用的,若我们要求“只有决定性的不利于他的证据才能判他有罪“,则他将被判为无罪,反之,若要”只有决定性的有利于他的证据才能判他无罪“,则他将被判有罪,在这里,也是着眼点的不同决定了看法,这类事件在日常生活中并不少见,原本不足为奇.