欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2023年数理统计讲义.pdf

    • 资源ID:93496871       资源大小:7.89MB        全文页数:65页
    • 资源格式: PDF        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2023年数理统计讲义.pdf

    数理记录教 案第一章记录量及其抽样分布第一节总体与样本教学目的:规定学生理解数理记录的两个基本概念:总体和样本,以及与这两个基本概念相关的记录基本思想和样本分布。教学重点:掌握数理记录的基本概念和基本思想.教学难点:掌握数理记录的基本概念和基本思想.一、总体与个体在一个记录问题中,我们把研究对象的全体称为总体,构成总体的每个成员称为个体。对多数实际问题。总体中的个体是一些实在的人或物。比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每个学生有许多特性:性别、年龄、身高、体重、民族、籍贯等。而在该问题中,我们关心的只是该校学生的身高如何,对其他的特性暂不予以考虑。这样,每个学生(个体)所具有的数量指标值身高就是个体,而将所有身高全体当作总体。这样一来,若抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的机会少,因此用一个概率分布去描述和归纳总体是恰当的。从这个意义上看,总体就是一个分布,而其数量指标就是服从这个分布的随机变量。以后说“从总体中抽样 与 从某分布中抽样 是同一个意思。例 1.考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0 记合格品,以 1记不合格品,则总体=该厂生产的所有合格品与不合格品 =由0 或 1组成的一堆数。若以P表达这堆数中1的比例(不合格品率),则该总体可由一个二点分布表达:X0 1p p p不同的p反映了总体间的差异。例如,两个生产同类产品的工厂的产品总体分布为:X 0 1T 0.983 0.017X 0 1P 0.915 0.085我们可以看到,第一个工厂的产品质量优于第二个工厂。实际中,分布中的不合格品率是未知的,如何对之进行估计是记录学要研究的问题。二、样本为了了解总体的分布,我们从总体中随机地抽取n个个体,记其指标值为x i,X 2,,X n,则XI,X 2,,Xn称为总体的一个样本,n称为样本容量,或简称样本量,样本中的个体称为样品。我们一方面指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是随机变量,用大写字母X l,X2,Xn表达;另一方面,样本在抽取以后经观测就有拟定的观测值,因此,样本又是一组数值。此时用小写字母XI,X 2,,Xn表达是恰当的。简朴起见,无论是样本还是其观测值,本书中样本一般均用XI,X 2,,Xn表达,读者应能从上下文中加以区别。例 2.啤酒厂生产的瓶装啤酒规定净含量为6 4 0 g,由于随机性,事实上不也许使得所有的啤酒净含量均为640g,现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果:641 635 640 637 642 638 645 643 639 640这是一个容量为10的样本的观测值。相应的总体为该厂生产的瓶装啤酒的净含量。从总体中抽取样本时,为使样本具有代表性,抽样必须是随机抽样。通常可以用随机数表来实现随机抽样。还规定抽样必须是独立的,即每次的结果互不影响。在概率论中,在有限总体(只有有限个个体的总体)中进行有放回抽样,是独立的随机抽样;然而,若为不放回抽样,则是不独立的抽样。但当总体容量N很大但样本容量n较小(而 脸 时,不放回抽样可以近似地看做放回抽样,即可近似看做独立随机抽样。下面,我们假定抽样方式总满足独立随机抽样的条件。从总体中抽取样本可以有不同的抽法,为了能由样本对总体做出较可靠的推断,就希望样本能很好地代表总体。这就需要对抽样方法提出一些规定,最常用的“简朴随机抽样 有如下两个规定:(1)样本具有随机性,即规定总体中每一个个体都有同等机会被选入样本,这便意味着每同样品x i与总体X有相同的分布。(2)样本要有独立性,即规定样本中每同样品的取值不影响其他样品的取值,这意味着Xl,X2,Xn互相独立。用简朴随机抽样方法得到的样本称为简朴随机样本,也简称样本。除非特别指明,本书中的样本皆为简朴随机样本。于是,样本X”.Xn可以当作是互相独立的具有同一分布的随机变量,其共同分布即为总体分布。设总体X具有分布函数F(X),X”X 2,,Xn为取自该总体的容量为n的样本,则样本联合分布函数为:歹(看,移,)=口 歹 =歹(为)歹)尸日)若总体具有密度 函数f(X),则样本的联合密度函数为/(为,=口 /)=/Wf&)若总体X为离背前随机变量,则样本的(联合)概率函数为汉瓦,瓦,&)=n p =舄 =P(X=X 1)P(X=电)P(X=&)显然,通常说的蔚:分布是指多维随机变量(X”X 2,,Xn)的联合分布。例3.为估计一物件的重量中用一架天平反复测量n次,得样本XI,X 2,,X n,由于是独立反复测量,XI,X 2,,Xn是简朴随机样本。总体的分布即X I的分布(XI,X 2,,Xn分布相同)。由于称量误差是均值(盼望)为零的正态变量,所以X I可认为服从正态分布N,o2)(X i等于物件重量M加上称量误差,即X I的概率密度为这样,样本分布密度为X 1 1 X卬F 口加皿一天力例4.设某种电灯泡的寿命X服从指数分布E(入),其概率密度为:m)=已 为 ;0,xo(j=1,2,0,其他.例5.考虑电话互换台一小时内的呼唤次数X。求来自这一总体的简朴随机样本Xl,X2,Xn的样本分布。解 由概率论知识,X服从泊松分布P(入),其概率函数Px(x)=P X=才 =-eA(A 0)rl,(其中x是非负整数 0,1,2,k,中的一个)。从而,简朴随机样本Xl,X2,Xn的样本分布为:,%,、)=广 丫(%)户*(0);=p(X =x M X =4)P(=r j的+登+”_ 0-也卒 引!H不/I I第二节记录量及其分布教学目的:规定学生理解数理记录的基本概念:记录量,纯熟掌握样本均值、样本方差、样本原点矩、样本中心矩等常用记录量的计算公式,掌握顺序记录量及其抽样分布。能用R软件来计算这些常用记录量,能用R软件来产生分布的随机数以进行随机模拟。教学重点:样本均值、样本方差、样本原点矩、样本中心矩等常用记录量的求法;顺序记录量的抽样分布。教学难点:顺序记录量的抽样分布。一、记录量与抽样分布样本来自总体,样本的观测值中具有总体各方面的信息,但这些信息较为分散,有时显得杂乱无章。为将这些分散在样本中有关总体的信息集中起来以反映总体的各种特性,需要对样本进行加工。最常用的加工方法是构造样本的函数,不同的函数反映总体的不同特性。定义1.设X”X 2,,Xn为取自某总体的样本,若样本函数T =T(XI,X 2,,x)中不具有任何未知参数,则称T为记录量。记录量的分布称为抽样分布。按照这一定义,若XI,X 2,,Xn为样本,则 ,W都是记录量,而当中为-)2 三,未知时,等均不是记录量。二、样本均值及其抽样分布定义2.设XI,X 2,,Xn为取自某总体的样本,其算术平均值称为样本均值,一般用F表达,即 阀 例6.某单位收集到2 0名青年人某月的娱乐支出费用数据:79 84 84 88 92 93 94 97 98 99100 101 101 102 102 108 110 113 118 125则该月这20名青年的平均娱乐支出为X=J-(79+84+-+1 2 5)=99.4对于样本均值F 的抽样分布,我们有下面的定理。定理L 设 X I,X 2,,X n 是来自某个总体X的样本,为样本均值。(1)若总体分布为N (M,o2),则f 的精确分布为 如方);(2)若总体X分布未知(或不是正态分布),且 E (X)=四,D (X)=,则当样本容量n较大时,的渐近分布为 W 盟4这里的渐近分布是指n较大时的近似分布。证明(1)由于F 为独立正态变量线性组合,故工仍服从正态分布。此外,_ 1 XE(x)=一Z (为)=一%=竭=4融)名 工献占 n1 n故x-jVCu,)n(2)x=易知 为独立、同分布的随机变量之和,且(x)=p,D(x)=放O由中心极限定理,lim P x 仪 -1 -1 闷)-1 9-1事实上,_ _ _2 _2Z&-加=Z W -2硒+x)=-2 0 Xi+nxi-1 i-1 7-1 5-1=Z N 一 2肪(Z)+咒彳=-咒xi-1 加 L1 5-1,偏差平方和的这3个表达式都可用来计算样本方差。例7.在例6中,我们已经算得7=。4,其样本方差与样本标准差为s2=7J-_(79-9 9.4)2+(84-9 9.4)2+(125-9 9.4)2 =13 3.936 85=7133.9368=1 1.573 L方法二-y(7 92+842+.+1 252)-2 0X 99.421=133,9368.,.s=ll.57 31通常用第二种方法计算s2方便许多。下面的定理给出样本均值的数学盼望和方差以及样本方差的数学盼望,它不依赖于总体的分布形式。这些结果在后面的讨论中是有用的。定理2.设总体X具有二阶矩,即E(x)=p,D(X)=o2(%)=+n,于是(Z(不一 I?)斗 3 +)一 双皿+)=(-i)o-2a两边各除以n-l,即得证。值得读者注意的是:本定理的结论与总体服从什么分布无关。四、样本矩及其函数样本均值和样本方差的更一般的推广是样本矩,这是一类常见的记录量。定义4.设X l,X 2,X n是样本,则记录量=(%*+K +.+#)称为样本k阶原点矩,特别地,样本一阶原点矩就是样本均值。记录量1 _尻=-(舄-X)称为样本k阶中心矩。常见的是k=2的场合,此时称为二阶样本中心矩。本书中我们将其记为s F以区别样本方差S 2。1 _S;=&-X)五、极大顺序记录量和极小顺序记录量定义5.设总体X具有分布函数F(X),分布密度f(X),X I,X 2,,X n为其样本,我们分别称X u =m i n x i,x 2,.x n ,x g=m a x x i,x 2,.x n 为极小顺序记录量和极大顺序记录量。定理3.若X,X(n)分别为极小、极大顺序记录量,则(1)x的分布函数 F i(x l-(1-F (x)n,x(1)的分布密度 f i(x)=n-(l-F(x)n-f(x)(2)X 的分布函数 F n(X)=F(X)F,x(n)的分布密度 f n(X)=n F(X)n lf(X)证明先求出X 及X 的分布函数Fl(X)及Fn(X):月(力=P 稳 x)=1 -P X i x,X2 z)=1-口 尸 侬 吊=1-(1-9(独居(%)=X)=P(X.X,-,JQ%)=H P(X i S x =(9(x)yz,分别对F l (x),F (x)求导即得水x)=耳(加=-(1-9 )1(1 -网项=峭-网x)”(x)f,=城歹厂】歹 =城歹厂】y(x)六、正态总体的抽样分布有很多记录推断是基于正态总体的假设的,以标准正态变量为基石而构造的三个著名记录量(其抽样分布分别为x 2分布,t分布和F分布)在实践中有着广泛的应用。这是由于这三个记录量不仅有明确背景,并且其抽样分布的密度函数有“明确的表达式“,它们被称为记录中的“三大抽样分布1.X?分布(卡方分布)定义6.设X l,X2,,X n独立同分布于标准正态分布N (0,1),则 x2=xF+X?的分布称为自由度为n 的(分布,记为x?x?(n)。x2(n)分布的密度函数见图14当随机变量x2 x2(n)时,对给定的a(0axa2(n)=a的 x j(n)是自由度为n 的开方分布的a 分位数。分位数xa2(n)可以从附表4 中查到。例如n=10,a=0.05,那么从附表4 中查得x2(l0)=18.307p(x)2x2o,o5(10)=p x2 18.307=0.05注:请读者注意x2 x2(n)时,n 是自由度,不是容量。2.F分布尸=看 包定义7.设xi x2(m),X2 x2(n)Xi与 X2独立,则称恐力的分布是自由度为 m 与 n 的 F 分布,记为F F(m,n),其中m 称为分子自由度,n 称为分母自由度。自由度为m 与 n 的 F 分布的密度函数的图像是一个只取非负值的偏态分布(见图 6-5)。Offie-s F分布的密度函数当随机变量F F(m,n)时,对给定的a(0 a F(m,n)=a 的数Fa(m,n)是自由度为m 与 n 的 F 分布的a 分位数。当 F F(m,n)时,有下面性质(不证)*、FW-=1 -a小 威).这说明对小的a,分位为Fa(m,n)可以从附表5 中查到,而分位数F r(m,n)则可通过上式得到。例 8.若取m=10,则 n=5,a=0.05,那么从附表5 上(m=m,n=n2)查得FO.O5(10,5)=4.74运 用(6.3.8)式可得到/Q/1 0,5)上=4=0.30.95 坨 一 0求5,10;3.333.t分布定义8.设随机变量与X i与 X2独立且Xi N(0,1),X2 X2(n),则称XX Jn的分布为自由度为n 的 t 的分布,记为t t(n).t 分布密度函数的图像是一个关于纵轴对称的分布(如下图),与标准正态分布的密度函数形态类似,只是峰比标准正态分布低一些,尾部的概率比标准正态分布的大一些。t分 布 与N(0,1)的密度函数当随机变量t t(n)时,称 满 足Ptta(n)=a的L(n)是自由度为n的t分 布 的a分位数,分 位 数L(n)可 以 从 附 表3中查到,例 如 当n=10,a=0.05时,从附 表3上查得to.O5(10)=1.8125由 于t分布的密度函数关于0对 称,故其分位数有如下关系:tl-a(n)=-ta(n)例如,to.95(10)=-t0.05(10)=-1.8125P(t-ta)=l-a,p(t tl-a)=l-a,A t l-a-t a4.一些重要结论来自一般正态总体的样本均值和样本方差S2的抽样分布是应用最广的抽样分布,下面我们加以介绍。定理4.设Xi,X2,.Xn是来自正态总体N(g,a2)的样本,其样本均值和样本方差分别为:_ I X 1 一,x=一工不和-=a -x),n 2-1 起 一1 2-1则有(1)f与S2互相独立;(2)4aS(4*=审4 F(7 T 特别,若 s(不证)推论:设,,尸莅二 并记 X(d+c$匕a 一婷+小/S、-加+%2 冽+%2则t=-(-X-V-)一(,巧 一.“,幽,+,/2C).、“4 k履(不证)本章小结本章的基本规定:(-)知道总体、样本、简朴样本和记录量的概念(二)知道记录量I和S2的下列性质:E(x)=_/nE(s2)=o2(三)若X的分布函数为F(X),分布函数为f(X),则样本(Xl,X2,X n)的联合分布函数为F(X1)F(X2).F (x n)样 本(X l,X 2,.X n)的联合分布密度为f(XI)f(X2).f (X n),样本(X l,X 2,.X n)的概率函数,p(X I,X 2.Xn)=p (X=X|)p(X=X 2)p(X=X n)因而顺序记录量X,.X 中X 1()的分布函数为1-(1-F(X)nX 的分布函数为 F(X)n(四)掌握正态总体的抽样分布若XN,o2)则有一、x 凶3)1 )n=歆 0,1)=正 戈 近 折1)(4)若 石 曾(外,才),也 阳 历&)尸=审4 旧(为一1,药_ 1)=5/,(五)知道样本原点矩与样本中心矩的概念第二章参数估计从本章开始我们介绍记录推断,所谓记录推断就是由样本推断总体,记录推断涉及参数估计和假设检查两部分,它们是记录推断最基本并且是互相有联系的两部分,本章介绍记录推断的第一部分参数估计。参数通常指总体分布中的特性值以和/和各种分布中的参数,例如二点分布B(1,P)中的p,泊松分布P(2)中的人正态分布N (屈、)的屈、/等,习惯用。表达参数,通常参数。是未知的。参数估计的形式有两类,设Xl,X2,.,Xn是来自总体的样本。我们用一个记录量次小,一%)的取值作为参数。的估计值,则 称为0的 点 估 计(量),就是参数,的点估计,假如对参数Q 的估计需要对估计作出可靠性判断,就需要对这一可靠性给出可靠性区间或置信区间,叫区间估计。下面一方面介绍点估计第 一 节 点 估 计教学目的:规定学生了解参数点估计的基本思想,理解参数点估计的基本概念,纯熟运用替换原理、矩法估计和最大似然估计对参数进行估计。教学重点:矩法估计、最大似然估计.教学难点:运用矩法估计、最大似然估计对参数进行估计.直接用来估计未知参数。的记录量3=4小,工)称为参数#的点估计量,简称为点估计,人们可以运用各种方法构造出很多。的估计,本节介绍两种最常用的点估计方法。它们是:矩法和极大似然法。一、替换原理和矩法估计用下面公式表达力的方法叫矩法忘=X女 x)=s/=(#一物a-守J.I例1.对某型号的2 0辆 汽车记录每5 L汽 油 的 行 驶 里 程(k m),观测数据如下:2 9.8 2 7.6 2 8.3 2 7.9 3 0.1 2 8.7 2 9.9 2 8.0 2 7.9 2 8.72 8.4 2 7.2 2 9.5 2 8.5 2 8.0 3 0.0 2 9.1 2 9.8 2 9.6 2 6.9这是一个容量为2 0的样本观测值,相应总体是该型号汽车每5 L汽油的行驶里程,其分布形式尚不清楚,可用矩法估计其均值,方 差,本例中经计算有7=2 8.6 9 5,=0.9 1 8 5由此给出总体均值,方 差 的 估 计 分 别 为 即 就=2 8.6 9 5,陵=s:=0.9 1 8 5矩 法 估 计 的 记 录 思 想(替 换 原 理)十 分 简 朴 明 确,众人都能接受,使用场合甚广。例2.设总体为指数分布,其密度函数为加工用=,巴 工 0 x i,.,x n是样本,由于以*)=;,亦即“=瓦 方,故7的矩法估计为;1 1A=r-=EX X例3.设XI,Xn是 来 自 服 从 区 间(0,4)上的均匀分布“(0,0的样本,4 0为未知参数。求的矩估计各。解:易 知 总 体X的均值为 Z=;(a +3)=;(0+3)2EX7.由矩法。的矩估计为#=黄=2斤比如,若样本值为0.1,0.7,0.2,1,1.9,1.3,1.8,则方的估计值f f=2x 7 (0.1+0.7+0.2+1+1.9+1.3+1.8)=2例4.在一批产品取样n件,发 现 其 中 有m件次品,试用此样本求该批产品的次品 率p的矩估计。解:由于/=工(月),.m.P=n例如抽样总数n=100,其 中 次 品m=5.p =-=-=0.05贝(T inn例5.电话总机在一分钟间隔内接到呼唤次数x p(2)o观测一分种接到呼唤次数共观测40次,结果如下接到呼唤次数012345观测次数51012832求未知参数2的矩估计彳解:V X-P (2).*.EX=2由矩法由=歹x=(2)计算 4fl(Ox5+lxl0+2x 12+3x8+4x3+5x2)=2:.A=2二、极大似然估计为了叙述极大似然原理的直观想法,先 看 例6例6.设有外表完全相同的两个箱子,甲箱中有99个 白 球 和1个黑球,乙箱中有99个 黑 球 和1个白球,现随机地抽取一箱,并从中随机抽取一球,结果取得白球,问这球是从哪一个箱子中取出的?解:不管是哪一个箱子,从箱子中任取一球都有两个也许的结果:A表达取出白球,B表达取出黑球,假如我们取出的是甲箱,则A发生的概率为0.9 9,而假如取出的是乙箱,则A发生的概率为0.0 1,现在一次实验中结果A发生了,人们的第一印象就是:“此 白 球(A)最像从甲箱取出的“,或者是说,应当认为实验条件对事件A出现有利,从而可以推断这球是从甲箱中取出的,这个推断很符合人们的经验事实,这里“最像”就是“极大似然”之意。本例中假设的数据很极端,一般地,我们可以这样设想,在两个箱子中各有100个球,甲箱中白球的比例是P l,乙箱中白球的比例是P 2,已知P|P 2,现随机地抽取一个箱子并从中抽取一球,假定取到的是白球,假如我们要在两个箱子中进行选择,由于甲箱中白球的比例高于乙箱,根据极大似然原理,我们应当推断该球来自甲箱。下面分别给出离散型随机变量和连续型随机变量的极大似然估计求未知参数的估计的环节(-)离散型随机变量第一步,从总体X取出样本X1,X2,Xn第二步,构造似然函数L(X l,X 2,.,X n,A)=P(X=X1)P(X=X2).P(X=Xn)第三步,计算In L (X l,X 2,.,X n,A)并化简第四步,当A=2时InL(xi,X 2,.,X n,A)取最大值则取2=4常用方法是微积分求最值的方法。(二)连续型随机变量若 X f(X,。)第一步 从总体X取出样本X1,X2,Xn第二步构造似然函数L (Xl,X2,.,Xn#)=f(X I,4)f(X2,4).f (Xn,A)第三步 计算In L (X l,X 2,.,X n,并化简第四步 当A=2时InL(xi,X 2,.,X n,A)取最大值则取方=4常用方法是微积分求最值的方法例7.设总体X B(1,P)即F,若A发生-0.若A不发牛设P(A)=P,从总体X中抽样XI,X2,X n,问最大似然法求力解:当 X B(1,P)时,应有尸(X=%)=p(l-p)EAP(X=l)=P,P(X=0)=1-P第一步构造似然函数L(X l,X 2,.,Xn,P)=P(X=X1)P(X=X2).P(X=Xn)=|,(1 广|。-9广 卜|(1-尸产=相+匕+Q _ .+%+,%)第二步 计算k l L(X1,X2,Xn,P)并化简=(xi+.+xn)ln p+(n-(xi+.+xn)I n (1-p)第 三 步 求 小 (”2)=P 1-PXi+/_ 为(%+4);.驻点为 P 1-P化 简 为(X1+Xn)(1-p)=pn-(X1+X n)/.(xi+.+xn)=n p.驻点 二由于只有一个驻点,a=3是最大点.,.取/=w例抽样n次A发生m次,则在xi,X2 X n中有m个I,其余为0,m.p-n例 8.(1)设总体X 服从泊松分布p(2),求2 的极大似然估计;(2)设总体X 服从指数分布E (2),求;?.的极大似然估计解:(1)V X-P (2)乙”;.p(X=k)=j f c l从总体X 中取样本X1 ,X2 Xn。2)=(不丸)=X)2-1 2-1ln Z(A)=4)ln 4 温一I n(辰%!天!)-d-ln-L-(-X-)=-Z-4-然=u,n3.驻点 4 _kS=xix解得2的极大似然估计1 4=七=五易知N 的矩估计亦为F(2)V X-E (2)AeX1,x00,x 0,X 2 0.X n 0 似然函数 L(XI,X2.Xn)=f(XI)f(X2).f (Xn)=a产)伏 六)a卢”七“-小+%)第二步 计算l n a,x,=+x.)第三步求导)=:-(为+4)2尸 n 驻点 X+.+4 7是最大点.取 S =15=1在例2中用矩法估计也是同样结果 短例9.设x U(0,4,2 _x f(x)=g0 x9即 0,其它从中取样Xl,X 2.X n,试用最大似然法求)解:由于样本XI,X2 Xn已经取出。所以应有 0X l,0X 2,.0Xn所 以#的 取 值 范 围 为-x,)w e +8第一步构造似然函数,及x_)=(x J p U )p(x_)=1 1 .1 1p n n很明显,似然函数1%,心月)是A的单调减函数,因此当A最小时,似然函数最大,由条件max(x 4,几)。+8知,的最小值为 =m a x;,扁,x.)所以。=m a式 ,r,,x.)时最大。取3=m ax(*,X,)这一结果与用矩法估计(例7 3)的结果方=2 7不同。例1 0.若X 加伍,),从中抽样XI,X2.Xn,试用最大似然估计法求:记左解:x的似然函数依,4x.)=/a)/(。)/)心,疥(石-4 1=(2叩2)2I n 3 4)=-方 力 包 -4 -/n,-?n(2/r)将I n ZS,厂)分别关于两个分量求偏导并令其为0即得到似然方程组号贮空3。加 Zi,(1)O l nZ)牛d W。则称葭为参数。的相合估计相合性被认为是对估计的一个最基本规定,假如一个估计量,在样本量不断增大时,它都不能把被估参数估计到任意指定的精度,那么这个估计是很值得怀疑的,通常,不满足相合性规定的估计一般不予考虑,证明估计的相合性一般可应用大数定律或直接由定义来证。例1 1.用大数定律证明&=三是的相合估计证:由切比雪夫大数定律l i m尸J -V-p =0.g I 即蚣HR-用)=o=W是 的相合估计为了避免用定义判断相合性的困难,下面介绍一个判断相合性很有用的定理:定量:设&=是4的估计量若 蚂*他 i(2)触。(4)=。则葭是。的相合估计。例 12.证 明 J是M 的相合估计证:在前面我们已经证明(1)仔)=/,、D&)=0 f Z 伏-x)=-j(2)-1(-1)n _ 2)Z G -x)-0(w-co)1.#=J是/的相合估计二、无偏性相合性是大样本下估计量的评价标准,对小样本而言,需要一些其他的评价标准,无偏性便是一个常用的评价标准。设$=灰不尼)是4的一个估计,Q 的参数空间为何,若对任意的。L何,有矶利=8则称,是加勺无偏估计,否则称为有偏估计。例 13.对任一总体而言,样本均值是总体均值的无偏估计,当总体k 阶矩存在时,样本k 阶原点矩应是总体k 阶原点矩区的无偏估计,但对k 阶中心矩则不同样,例如,二阶样本中心矩 就不是总体方差/的无偏估计,事实上,对此,有如下两点说明(1)当样本量趋于无究时,有我们称S?为 的渐近无偏估计,这表白当样本量较大时,S?可近似看作/的无偏估计(2)若对 作如下修正:1则J是总体方差的无偏估计,这种简章的修正方法在一些场合常被采用,/它比M 更常用,这是由于在12时-,s?总 因此用s?估计有偏小的倾向,特别在小样本场合要使用 估计/。无偏性不具有不变性。即若方是。的无偏估计,一般而言,g(方)不是g(,)的无偏估计,,除非g 9)是#的线性函数,例如,9是/的无偏估计,但 S不是rr的无偏估计例 14.证明户=4%+风羽+是的无偏估计0 4+2+a,=1。其中,%,兀是X 的样本证:e立=演4及+T&+a,x.)=冬防+2 她 +a.Ex.二冬&+a.Ex=依+冬+4)&=(4+2+4)户.a=+为+a.=1特别情形2=G 是的无偏估计例 15.证明行2 =J是M 的无偏估计证.k-司 4才-、.七力a-矛=(i x-晟 )Ji J a l_ 力 耿;-闷7=力(4+4)-%C 0 G)+(砂)-J.1 J.1(*2 +即 2)_ 力(!,+=(n-1)(72.ES2=-1-(-x)2=J.(-1)(=o2 -11 我 一 1三、有效性参数的无偏估计可以有很多,那么如何在无偏估计中进行选择?直观的想法是希望该估计围绕参数真值的波动越小越好,波动的大小可以用方差来衡量,因此人们常用无偏估计的方差的大小作为度量无偏估计优劣的标准,这就是有效性。定义4.设标瓦是加勺两个无偏估计,假如对任意的AL向有D(命 D(合 力则称认比布 效例 16.设XI,Xn是取自某总体的样本,记总体均值为,总 体 方 差 为 则=%,区=三都是的无偏估计,但色)=,,)=-7 显然,只要n l,瓦比番有效,这表白,用所有数据的平均估计总体均值要比只使用部分数据更有效。._ 1 1 ._ 1 2例 17.比 较 药+,电 与 巧 谁 有 效解.()从=(亍 再 +,)=+#12 12 1 2 四=(彳百+彳电)=7 明+=,+彳=a N与向都是的无偏估计=D(x1+1 )=D(-Xj)+D(-x2)、N*/7.7.7.11 1 2 1 Q 2 2 1-UXy+DK=b+L=。4=b=4 1 4 2 4 4 4 21?1 2口k =0(彳/+彳)=/?(再)+D(-Xj)1 4 n 1 2 4 2 5-DK、+D%=-b/+=9 1 9 J 9 9 9比有效例 18.设入。0,2夕,从总体中取样片,I,x.2-夕=-X证明 3 是。的无偏估计和相合估计w,、耿=2竺3解:(1)7.22.3 431 .=3,Dx=*2 12“=(2 =2 加=2 耿=工 3 夕=83 3 3 3 2八 2-夕=-X?是。的无偏估计-9-4-4 1D(g)=D(-x)=-D x=-士Dx3 g 9 n 92=4。(力-=9%12 27盟-2-夕=-XJ 7 是。的相合估计第三节参数的 区 间 估 计教学目的:规定学生了解置信区间的基本思想,理解置信区间的基本概念,掌握求置信区间的枢轴量法方法,纯熟掌握正态总体参数置信区间的计算公式和大样本置信区间。能用R软件计算正态总体参数的置信区间。教学重点:置信区间的思想、概念和枢轴量法方法,计算正态总体参数的置信区间。教学难点:计算单个正态总体的置信区间以及两个正态总体下的置信区间。用点估计去估计总体的参数,即使是无偏且有效的,也会由于样本的随机性,使得从一个样本XI,X2,X 3,,Xn算得的估计值不一定是被估计的参数的真实值,并且估计值的可靠性并不知道,这是一个重大的问题,因此,必须解决根据估计量的分布,在一定可靠性的限度下指出被估计的总体参数的取值范围,这正是本节要介绍的参数的区间估计问题。一、置信区间概念为了引入置信区间的概念,请看下面的引例。引例 设某种绝缘子抗扭强度x 服从正态分布方3。与 其中未知,厅2已知(rr=45公斤 米),试对总体均值作区间估计。对于区间估计,要选择一个合适的记录量,若在该总体取一个容量为n 的样本XI,X2,X 3,,x ,样本均值为工的点估计即装然而我们要给出耳的一个区间估计,以体现出估计的误差,我们知道”丁)。在区间估计问题中,要选取一个合适的估计函数。这时,可取一二一,它是指勺标准化随机变量,且具有下面两个特点:(1)U中包含所要估计的未知参数(其中b已 知);(2)u 的分布为N(0,1),它与未知参数无关。由于uN(0,1),因而有户 同%=0(0 a 1)根据uN(0,1)的概率密度X x)的对称性(见下图)Pua y-a (0 a 1)可 得 I 2 J oua|w|w _,-u u u当a=0.0 5时,l-a=0.0 9 5,*1.9 6,将不等式 下 转化为 T 方,亦即-b /一 a%/X Mx十%丁因此有%=%0 2 5 =1.9 6当 a=0.0 5 时,aP x-1.9 6-7 /x +1,9 6J 甩以-1.9 6 乡,+1.9 6 9说明未知参数包含在区间中 g 的概率是9 5%,这里,不仅给出了以的区间估计,还给出了这一区间估计的置信度(或置信概率)。事实上,当置信度为1-a时,区间估计为 l x%了 赤 五寺-Ji=在引例中,若才=1 6 0,7=40,n=1 6。则有1 1.9 6=1 6 0-1.9 6 x40=1 40.4“1.9 6=1 6 0+1.9 6 x407 1 61 7 9.6尸(1 40,4 1 7 9.6)=0.9 5说明该绝缘子抗扭强度X的盼望在(1 40.4,1 7 9.6)内的可靠度为0.9 5。下面,引出置信区间的概念。定义5.设(9为总体的未知参数筋=员(再,马,x*,4),,=济(国,&,是 由 样本X,%,匕,,天定出的两个记录量,若对于给定的概率1-a (0al),有产 1 wew 总)=1 -a,则随机区间,1自1称为参数/?的置信度为1-a的置信区间,,称仇=仇(再,再,匕,,居),&=8 a(X,马,W,,4)为置信下限,仇称为置信上限。置信区间的意义可作如下解释:胞 含 在 随 机 区 间 中 的 概 率 为i o。(1-a)%;或者说,随机区间同自 以1 0 0(1-a)%的概率包含以粗略地说,当a=0.0 5时,在 1 0 0 次的抽样中,大体有9 5 次白包含在I 8,依 I中,而其余5次也许不在该区间中。a常取的数值为0.0 5,0.0 1,此时置信度1-a 分别为0.9 5,0.9 9 置信区间的长度可视为区间估计的精度,下面分析置信度与精度的关系。(1)当置信度1-a 增大,又样本容量n固定期,置信区间长度增大,即区间估计精度减低;当置信度1-a 减小,又样本容量n固定,置信区间长度减小,即区间估计精度提高。(2)设立信度1-a 固定。当样本容量n增大时,置信区间减小(如引例中,置信区间长度为 了 忘),区间估计精度提高。二、单个正态总体参数的置信区间正 态 总 体 是 最 常 见 的 分 布,本小节中我们讨论它的两个参数的置信区间。1 已知时”的置信区间设总体X 服从正态分布N S。*),其中M已知,而以未知,求的置信度1-a 的置信区间。这一问题事实上已在引例中的讨论中解决,得到产(X-%-=x+ua 卜=l-a2 7n 亍 所以的置信度1-a 的置信区间为T7 oua ua当 a=0.0 5,五=1.9 6;当 a=0.0 1,*2.5 7 6。例 1.某车间生产滚珠,从长期实践知道,滚珠直径X 服从正态分布。从某天产品里随机抽取6个,测得直径为(单位:毫米):1 4.6,1 5.1,1 4.9,1 4.8,1 5.2,1 5.1 若总体方差。.(垢,求总体均值的置信区间(a=0.0 5,a=0.0 1)。解x =1 4 9 5,a=0.0 5 时,置信度为9 5%的置信区间为 /T-/Tx-1.96,,x+l 96,=14 95-1y/n yjn,1495+196贷 14 75.15 151a=0.0 1 时,置信度为9 9%的置信区间为次一 2.5 7 6 多,+2.5 7 6。郃1 46 9,1 5.2 1 yjn sjn从此例知,在样本容量n固定期,当置信度1-a 较大时,置信区间长度较大;当置信度l-a 较小时,置信区间较小。例 2.用天平称量某物体的质量9 次,得平均值为X 1 5.4(g),已知天平称量结果为正态分布,其标准差为0.1 g,试求该物体质量的0.95置信区间。解 此 处 l-a=0.95,a=0.0 5,查表知1 1 0.0 25=1.96,于是该物体质量”的 0.95的置信区间为-?=1 5,41 1.96 x 41 =1 5.40.0 6 53彳金 圾,从而该物体质量的0.95置信区间为 1 5.3347,1 5.46 53。例 3.设总体为正态分布M 3,D,为得到以的置信水平为0.95的置信区间长度不超 过 1.2,样本容量应为多大?解由题设条件知”的 0.95置信区间为睦 _耍x-f=,x+=yn,%2工其区间长度为 苏,它仅依赖于样本容量n而与样本具体取值无关。现规定,22-(一 以 ua,即有 1 2 3 现 l-a=0.95,故Q=1.96,从而(-)2x l.962=1 0.6 7 1 1o 即样本容量至少为1 1 时才干使得的置信水平为0.95的置信区间长度不超过1.2o2”未知时的置信区间近狂也这时可用t记录量,由于 s I%)=2 2:即 力)=&产(工(-1)4(%一 D)=1 -a2 2解得K-ian-X)-3 7)=(叱 I)=Y它们满足 亍 2 彳 2。(见下图)尸(/=力5-1)41-1 2,尸(2;2 5 -D&三舅 5 T)=1-a1-2 2将上式开方即可得标准差”的置信区间。例 5.某厂生产的零件质量X 服 从 正 态 分 布 现 从 该 厂 生 产 的 零 件 中 抽取 9 个,测得其质量为(单位:g)45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6试求总体标准差b的0.95置信区间。解由数据可算得 S2=0.0 3 2 5,(n-1)$2=8X0.0 3 2 5=0.2 6,这里 a=0.95,查表知(8)=2.1797,(8)=17,5345i f o 代入公式可得标的。95置信区间为0.26 0.2617 5245 2 1797=0,0148,0.1193从而 的 0.95置信区间为0.1218,0.3454o以上关于正态总体参数的区间估计的讨论列表如下表所示。表7-1 正态总体参数 为区间估计表所估参数条件估计参教置信区间,已知a -%丁,x+%丁】I Id未知sx-J .x+G(-1)-=01WQ-I)N=5-I)本章小结本章考核规定:(-)点估计(1)知道点估计的概念

    注意事项

    本文(2023年数理统计讲义.pdf)为本站会员(文***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开