概率论与数理统计第19讲 .doc





《概率论与数理统计第19讲 .doc》由会员分享,可在线阅读,更多相关《概率论与数理统计第19讲 .doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率论与数理统计第19讲(夜大)第六章 假设检验 统计推断的另一类重要问题是假设检验问题。在总体分布函数完全未知或只知道其形式,但不知道其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设,然后根据样本对所提出的假设作出是接受,还是拒绝的决定。 例1 生男生女问题。按照现代生物学观点,生男生女机会应该相同。但是历史上统计数据却与之相矛盾,即生男的机会略大于生女。最早提到这一现象的是英国的统计学家格朗特(他是一名服装店主的儿子,子承父业,后来自学成才),他在其著名的著作关于死亡公报的自然和政治观察(该书是第一部系统论述统计数据处理方面的著作,有人认为它标志着统计学的开端)一书中,根据
2、多年的统计资料,计算出当时伦敦生男生女的比率为14:13。后来,印度的著名统计学家劳在所著统计与真理一书中再次提到了这一现象(他让研究生去加尔各答印度统计所附近的一家医院,记录出生婴儿的情况)。到1710年,有一位名叫阿布兹诺特的学者,在英国皇家学会宣读了一篇题为从两性出生数观察的规律性所得关于神的旨意存在的一个论据的论文,从数学的观点对此问题进行了分析。他研究了82年伦敦出生的男女婴数目,发现在这连续82年总都是男多于女。他于是这样推理:有两种可能性:(1)生男生女纯属偶然(即机会均等);(2)由于“神的旨意”,生男的机会大于生女。如果(1)成立,则在一年内出生的男婴多于女婴的概率,不超过1
3、/2,因而连续82年出现这种情况的概率,不应超过。这个问题可以这样理解,好比从一个有1亿亿亿个球,其中只有一个白球,要在一次随机抽样中恰好抽到这个白球这样小的一个概率事件居然发生了。这是不和情理的。因此,我们有理由否定(1)而接受(2)。 阿布兹诺特的工作在统计史上有重要的意义,因为他首先提出了利用统计数据去验证一种说法(理论、学说、假说等)是否成立的问题,并在该特定的问题中提出了具体的处理方法。经过20世纪前期一些重要的统计学家的发扬光大,发展成统计推断中最重要的分支之一假设检验。 例2 “女士品茶”。我们曾多次提到的费舍,是这些大学者之一。他曾用一个“女士品茶”的例子来说明他的“显著性检验
4、”思想。一种饮料由牛奶和茶混合而成,调制时可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。有一位女士说她能分辨此二者。费舍设计了一个试验来检验该女士的说法是否正确。试验的布置是:准备8杯看上去一样的饮料,其中TM和MT各4杯,把这一点告诉该女士(当然不指出哪4杯是MT),然后让她品尝这8杯饮料,指出哪4杯是TM。根据她的回答来估量她是否确有分辨TM和MT的能力。 现设结果是该女士4杯全说对了,该如何评估这个结果?费舍的推理与阿布兹诺特相似:假设该女士毫无分辨能力,则这8杯饮料对她来说毫无差别,她从中挑出4杯,纯粹是一种随机举动,即挑出任意4杯都有同等可能。从8杯中挑出4杯的不同挑法,有种,其中只有一
5、种是全部挑对,其概率是1/70。因此,在“该女士4杯全部挑对”这个试验结果出现时,只有两种可能的解释: (1)该女士对TM和MT并无鉴别能力,所得结果纯属偶然; (2)该女士对TM和MT有一定的鉴别能力。 按上面的计算,若坚持第一种解释,则我们就必须承认:发生了一件其概率只有1/70的事情。由于概率相当小,这看上去不太可信,因而我们摒弃这一解释而接受第二种解释。费舍由此得到结论:该女士对TM和MT具有一定的鉴别能力。 费舍的推理中包含了以下几个要点:(1)问题是要辩明试验结果是否支持某种效应(如分辨能力);(2)把“效应不存在”作为一个假设(如本例中无鉴别能力);(3)找一个显示结果与假设之间
6、的偏差的量,在“假设正确”的前提下,计算出现这么大偏差的概率P;(4)如果概率小到某个程度,以至于认为发生概率这么小的事件不可信,则认为数据没有给假设以足够的支持,或反过来说,数据支持“效应存在”的说法。反之,若概率并非足够小,则数据没有给予“否定假设”以足够的支持,换句话说,对“效应存在”的说法,从数据中并未得到充分的支持。 为使大家对这个过程有更清楚的了解,我们再对上面的例子进行分析。用X表示该女士挑对的杯数,X可以取0,1,2,3,4。若X=0,1,2,则显然不构成怀疑假设正确的理由,因为她即使凭空瞎猜,平均也有猜中2杯的可能。若X=3,4,则表面上显示了她可能有一定的鉴别能力,但是否已
7、经超出了“瞎猜”所能解释的范围呢?这就要具体分析。X=4的情况我们已经进行了分析,如果瞎猜,概率只有1/70,这数字太小,小到我们感到,如果把它委之于碰运气不合理的程度了,因而我们倾向于否定她没有鉴别能力的假设。若X=3,则计算表明,即使纯粹凭借瞎猜,该女士得出这么好乃至更好的概率,也有,接近1/4。这个概率不算太小。好比说4人抽签分一张票,你有幸抽中了,算不上碰上大运气的事。因此,我们可以认为,X=3这个结果没有给否定“女士无鉴别能力”这个假设以充分的支持。 费舍把这种性质的推理称为“显著性检验”。显著一词,是指由数据中反映“效应存在”的显著程度如何,而这显著程度则是用概率来表示的,概率愈小
8、,显著性愈高,肯定效应存在的理由就愈充分。 例3 某车间用机器包装葡萄糖。袋装糖重是一随机变量,服从正态分布。当机器工作正常时,均值为0。5公斤,标准差为0。015公斤。某日开工后为检验机器工作是否正常,随机抽取9袋得到样本均值,问机器工作是否正常? 解:以分别表示糖重总体的均值和标准差。经验表明标准差比较稳定,我们设保持不变。于是问题变为,未知,根据样本来判断还是。为此,我们提出两个相互对立的假设:然后,我们给出一个合理的法则,根据这一法则,利用已知样本作出决策是接受假设(即拒绝),还是拒绝假设(即接受)。如果作出的决策是接受假设,则认为,即认为机器工作是正常的,否则,则认为不正常。 由于要
9、检验的假设涉及总体均值,故我们很自然想到是否可用样本均值来进行判断。由于是的无偏估计,的观察值的大小在一定程度上反映了的大小。因此,如果假设为真,则观察值与的偏差一般不应太大。若过分大,我们就怀疑假设的正确性而拒绝。考虑到当为真时,。而衡量的大小可归结为衡量的大小。基于这样的想法,我们可适当选定一正数,使当观察值满足时就拒绝假设,反之,若,就接受假设。 然而,由于作出决策的依据是一个样本,当实际上为真时仍然可能作出拒绝的决策(这种可能性是无法消除的),这是一种错误,犯这种错误的概率记为 P当为真拒绝或者拒绝或拒绝记号表示参数取时事件发生的概率,表示取规定的值时事件的概率。我们无法排除犯这类错误
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论与数理统计第19讲 概率论 数理统计 19

限制150内