《大学课件概率论 第6章 数理统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《大学课件概率论 第6章 数理统计的基本概念.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数 理 统 计,数理统计的基本概念,引 言,随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。,概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知的基础上得出来的。,但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。,例如:,某公路上行驶车辆的速度服从什么分布是未知的;,电视机的使用寿命服从什么分布是未知的;,产品是否合格服从两点分布,但参数合格率p是 未知的;,数理统计的任务则是以概率论为基础,根据试验 所得到的数据,对研究对象的客观统计规律性做出合 理的
2、推断。,数理统计方法具有“用局部推断整体”的特征 .,在数理统计中,不是对所研究的对象全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.,总体、样本和统计量,总体与样本,在数理统计中,把研究对象的全体称为总体,而把组成总体的每个单元称为个体。,总体可以认为是一个随机变量,而个体的取值就是该随机变量的一个观测值。,按一定原则从总体中抽取若干个个体进行观察,这个过程叫做抽样。,一旦取定一组样本 X1, ,Xn ,观察得到 n 个具体的数 (x1, x2, , xn),称为样本的一次观测值,简称样本值 .,n 称为这个样本的容量.,从
3、总体X中第i次抽取的个体指标为Xi(i=1,2n),则我们称X1, ,Xn是总体X的一组样本,因为我们在抽样之前无法预测Xi的取值,所以 Xi是一个随机变量。,随机抽样方法的基本要求,独立性每次抽样的结果既不影响其余各次抽 样的结果,也不受其它各次抽样结果的影响。,满足上述两点要求的样本称为简单随机样本.获得简单随机样本的抽样方法叫简单随机抽样.,代表性样本( )的每个分量 与总体 具有相同的分布。,从简单随机样本的含义可知,样本 是来自总体 、与总体 具有相同分布的随机变量.,简单随机抽样,例如:要通过随机抽样了解一批产品的次品率, 如果每次抽取一件产品观测后放回原来的总量中,则 这是一个简
4、单随机抽样。,但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,若总体的分布函数为F(x)、分布密度函数为f(x),则其简单随机样本的联合分布函数为,其简单随机样本的联合分布密度函数为,F(x1 , x2 , , xn) =F(x1) F(x2) F(xn),f(x1 , x2 , , xn) =f(x1) f(x2) f(xn),统计量,定义 设( )为总体X的一个样本, 为不含任何未知参数的连续函数,则 称 为样本
5、( )的一个统计量。,则,例如: 设 是从正态总体 中抽取 的一个样本,其中 为已知参数, 为未知参数,,是统计量,不是统计量,几个常用的统计量,样本均值:,设 是总体 的一个样本,,样本方差:,修正样本方差:,样本k阶原点矩:,样本k阶中心矩:,顺序统计量:,样本极差:,样本中位数:,经验分布函数,设总体X的分布函数为FX,利用伯努利大数定律可以证明,对于任意0,有,故当样本容量 n 足够大时,经验分布函数与总体的分布函数差距很小。因此只要样本容量足够大,就可以近似推断总体的分布。,事实上,对于任意 x ,我们可以定义事件 A=随机变量取值 xtx,则由伯努利大数定律,而,故有,样本均值与样
6、本方差的数字特征,证明:(1),(2),命题6.3.5 设总体 X 的分布函数为 FX,分布密度 函数为 fX,则,顺序统计量的分布,证明:,数理统计中常用的分布除正态分布外,还有三个非常有用的连续型分布,即,数理统计的三大分布(都是连续型).,它们都与正态分布有密切的联系.,分布,定义 设总体 , 是 的一个样本, 则称统计量 服从自由度为n的 分布,记作,自由度是指独立随机变量的个数,分布的密度函数为,其中Gamma函数 (x) 通过下面积分定义,一般的,若X的分布密度函数为,则称X服从参数为0和0的分布,记为X (, )。 分布的数学期望和方差为,不难看出,其图形随自由度的不同而有所改变
7、.,分布密度函数的图形, 2分布的性质,设X 2(n),则EX=n,VarX=2n.,证明:,利用公式:, 2分布的可加性,若 且X1, X2相互 独立,则,若 则当 n 趋于无穷时,近似的有,证明:由中心极限定理,这里,可得,性质 设(X1,X2,Xn)为取自正态总体XN( , 2) 的样本,则,证明,由已知,有,故,定理 设(X1,X2,Xn)为来自正态总体 XN( , 2) 的样本,则样本均值 与样本方差 Sn2 相互独立;,(1),(2),比较 设(X1,X2,Xn)为取自正态总体 XN( , 2)的样本,则,只证明(1): 为X1,X2,Xn的线性组合,故仍然 服从正态分布,而,故,
8、(2)式的自由度为什么是 n-1?,这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(2)式的自由度是n-1.,定理(抽样分布基本定理) 设(X1,X2,Xn)为来自 正态总体 XN(0 , 1)的样本,则样本均值 与样本 方差 Sn2 相互独立;,(1),(2),t分布,定义:,设随机变量 XN(0,1),Y 2(n) ,且X与Y相互独立,则称统计量,服从自由度为 n 的 t 分布,,记作,t 分布的概率密度函数为,T t(n).,其形状类似标准正态分布,关于 x=0 对称.,当 n 较大时, t分布近似于标
9、准正态分布.,一般说来,当 n30 时,t 分布与标准正态分布N(0, 1)就非常接近.,但对较小的 n 值,t 分布与标准正态分布之间有较大差异. 且 P(|T| t0) P(|X| t0) (对于较大的t0) ,其中 X N(0, 1),即在 t 分布的尾部比在标准正态分布的尾部有着更大的概率.,当 n 趋于无穷时, t 分布趋于标准正态分布.,t 分布的数学期望与方差,设 Tt (n),则,定理,设(X1,X2,Xn)为来自正态总体 XN( , 2)的样本,则统计量,证:,故,由于,由t分布定义得,定理,设(X1, X2, , Xn1)和(Y1, Y2, , Yn2) 分别是来自正态总体
10、 N(1 , 2) 和 N(2 , 2) 的样本,且它们相互独立,则统计量,其中,证明:,因此,由已知条件可得,故,又因为,故,因此,F分布,服从第一自由度为 n1,第二自由度为 n2 的F分布,,显然,若 Z F(n1, n2),则 1/Z F(n2, n1).,F分布的分布密度函数:,其中,定理,为正态总体 的样本容量和样本方差;且两个样本相互独立,则统计量,设 为正态总体 的样本容量和样本方差;,证明,由已知条件知,且相互独立,,由F 分布的定义有,例1 设总体 XN(0,1), X1, X2, , Xn为简单随机样本,试问下列统计量各服从什么分布?,解,(1),因为 XiN(0,1),
11、i=1, 2, , n.,所以,X1 X2 N(0, 2),,故,t(2).,例1 设总体 XN(0,1), X1, X2, , Xn为简单随机样本,试问下列统计量各服从什么分布?,续解,(2),因为X1N(0,1),,故,t(n-1).,例1 设总体 XN(0,1), X1, X2, , Xn为简单随机样本,试问下列统计量各服从什么分布?,续解,(3),因为,所以,F(3, n-3).,例2 若 Tt(n), 问T 2服从什么分布?,解,因为 Tt(n),,可以认为,其中UN(0,1), V2(n),,U22(1),, F(1, n).,分位数,设 X f (n)(f 为某种分布,n 为有关的自由 度),01,则称满足,的数 f(n) 为分布 f (n) 的 分位数(或分位点),查课本后面的表可得 2分布, t 分布, F 分布 的分位数。,注意,对于 t(n) 分布,当 n 趋于无穷时,分布趋于 N(0,1),故当自由度较大时,用标准正态分布的分位数 u 代替 t(n) 的分位数。,若X 2(n) 分布,当n趋于无穷时, 近似的服从 N(0,1),故当自由度较大时,近似的有,对于 F(m,n) 分布和 (01),有,第六章知识小结,第六章知识小结,第六章知识小结,作业: 5, 6, 7, 14, 16, 17, 18,
限制150内