总体分布样本分布讲稿.ppt
关于总体分布样本分布第一页,讲稿共九十一页哦提示如何依据样本的信息推断总体的特征参数估计问题样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量例如:样本均值、例如:样本均值、例如:样本均值、例如:样本均值、比例、方差比例、方差比例、方差比例、方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等第二页,讲稿共九十一页哦有关概率概念的回顾通俗地说:通俗地说:概率是衡量某一特定事件的机会或可能性的数值概率是衡量某一特定事件的机会或可能性的数值度量度量。它可以用来度量如下一些问题中的可能性。它可以用来度量如下一些问题中的可能性如果提高产品的价格,则销售下降的如果提高产品的价格,则销售下降的“机会机会”有多少?有多少?某种新的装配作业方法会在多大某种新的装配作业方法会在多大“可能性可能性”上提高生产率?上提高生产率?某项工程按期完成的某项工程按期完成的“可能性可能性”有多大?有多大?新投资赢利的新投资赢利的“机会机会”有多大?有多大?概率在决策过程中起着重要作用,它提供了一种机制来衡量、概率在决策过程中起着重要作用,它提供了一种机制来衡量、表达和分析与未来事件相联系的不确定性。表达和分析与未来事件相联系的不确定性。第三页,讲稿共九十一页哦一些相关概念随机实验随机实验 至少有两个或两个以上的结果但事先不知道会发生哪个至少有两个或两个以上的结果但事先不知道会发生哪个结果的过程。结果的过程。随机事件(简称为事件)随机事件(简称为事件)一个随机实验的可能结果称为一个随机实验的可能结果称为基本事件基本事件。所有基本事件的集合称为所有基本事件的集合称为总体(样本空间)总体(样本空间)。总体的子集称为。总体的子集称为随随机事件机事件。概率的定义(见教材概率的定义(见教材p2)。)。任何满足定义中三个条件的函数任何满足定义中三个条件的函数P(A)都可以作为一种合适的概都可以作为一种合适的概率分配方式。常用的概率分配方式有:率分配方式。常用的概率分配方式有:古典法古典法(抛掷硬币)、(抛掷硬币)、相对频数法相对频数法(产品销路调查)和(产品销路调查)和主观法主观法(体育比赛结果预测)。(体育比赛结果预测)。第四页,讲稿共九十一页哦5.1总体分布与样本分布本章的本章的总体总体(Population or Universe)是指研究对象的是指研究对象的全体。并且先研究只有一个特征(指标或变量)的全体。并且先研究只有一个特征(指标或变量)的总体。这样表述总体特征的变量可以看成一个总体。这样表述总体特征的变量可以看成一个一维一维随机变量随机变量。例如我们在某个研究中关注广州市的某区居民的某年经济收入情况,我们在这个问题中的总体就是广州市某区居民的全体,但我们实际上关注的是该区居民该年的经济收入这样一个特征,我们可以用一个变量X来表征我们任意选取的一个该区居民该年的收入。则X是一个一维随机变量,而我们研究的总体实际上是这一随机变量取值的全体。因此,因此,总体也可理解为一个随机变量取的值全体。总体也可理解为一个随机变量取的值全体。第五页,讲稿共九十一页哦5.1.1 总体与总体分布总体与总体分布更准确地说,一维随机变量是指反映某总体特征取值,更准确地说,一维随机变量是指反映某总体特征取值,且具有如下特点的变量且具有如下特点的变量X:(1)在同一条件下可以无限次重复取值;)在同一条件下可以无限次重复取值;(2)取值的结果可能有多个,但不确定;)取值的结果可能有多个,但不确定;(3)事先不知道取值结果)事先不知道取值结果(Outcome)。由此可知,随机变量可以理解为“随机实验(随机地抽取一个个体)”结果的数值性描述。第六页,讲稿共九十一页哦随机变量取值的概率分布,就称为随机变量取值的概率分布,就称为总体分布总体分布。一个随机变量取给定值或属于一给定值集合的概率所确定一个随机变量取给定值或属于一给定值集合的概率所确定的函数称为该随机变量的的函数称为该随机变量的概率分布概率分布。概率分布反映的是。概率分布反映的是随机变量所有可能取值的概率的分配方式。一旦与所随机变量所有可能取值的概率的分配方式。一旦与所有可能结果相联系的概率被确定,则概率分布完全确有可能结果相联系的概率被确定,则概率分布完全确定。定。X x1 x2 xn P(X)p1 p2 pn 无论是理论研究还是解决实际问题,知道一个随机变量取各种可能值无论是理论研究还是解决实际问题,知道一个随机变量取各种可能值的概率情况(概率分布)都是十分重要的。的概率情况(概率分布)都是十分重要的。第七页,讲稿共九十一页哦离散随机变量的概率分布。设离散随机变量的概率分布。设X为取相异值为取相异值x1,x2,xn,的离散随机变量,则函数的离散随机变量,则函数称为称为X的概率分布或概率分布函数的概率分布或概率分布函数(probability distribution function,PDF),其中,其中P(X=xi)为离散为离散随机变量随机变量X取取xi值的概率。值的概率。(1)离散随机变量的概率分布)离散随机变量的概率分布第八页,讲稿共九十一页哦(2)连续随机变量的概率密度函数)连续随机变量的概率密度函数设设X是连续随机变量,是连续随机变量,x是是X取的值,若函数取的值,若函数f(x)满足下满足下列条件:列条件:则称则称f(x)为为X的概率密度函数的概率密度函数(probability density function,PDF),其中,其中P(ax b)表示表示X在区间在区间(a,b取值取值的概率。的概率。第九页,讲稿共九十一页哦有时也称下式定义的函数为有时也称下式定义的函数为X的的概率分布函数概率分布函数:连续型随机变量取给定值的概率为零。连续型随机变量取给定值的概率为零。f(x)xab第十页,讲稿共九十一页哦5.1.2随机样本与样本观察值从重复抽样的角度看从重复抽样的角度看“每次从总体中随机抽取个体每次从总体中随机抽取个体”可理可理解为一个随机实验。解为一个随机实验。随机样本随机样本:表征:表征n次抽取个体的随机抽样的一组随机变次抽取个体的随机抽样的一组随机变量量X1,X2,Xn.样本观察值(样本数据)样本观察值(样本数据):n次随机抽样的结果:次随机抽样的结果:x1,x2,xn(称为随机变量(称为随机变量X1,X2,Xn的样本观察值)。的样本观察值)。n称称为为样本容量样本容量。注:注:x1,x2,xn也可以看成随机变量也可以看成随机变量X的的n次重复抽样次重复抽样的结果。的结果。第十一页,讲稿共九十一页哦大写的英文字母:随机变量小写的英文字母:随机变量的观察值例例 抛掷一个均匀的骰子,假设骰子的六个面分别标有数字抛掷一个均匀的骰子,假设骰子的六个面分别标有数字1,2,3,4,5,6。用。用X标识骰子落地后朝上一面的数字。标识骰子落地后朝上一面的数字。则则X是离散随机变量。是离散随机变量。对该随机变量进行一次抽样,其实就是掷该骰子一次。对该随机变量进行一次抽样,其实就是掷该骰子一次。第第i次抽样,就是第次抽样,就是第i次掷骰子,其结果的表示:次掷骰子,其结果的表示:事前事后Xixi易见,易见,Xi其实就是其实就是X第十二页,讲稿共九十一页哦5.1.3样本分布函数设设x1,x2,xn是随机变量是随机变量X的样本观察值,将它们按大的样本观察值,将它们按大小顺序排列,排序后为小顺序排列,排序后为x1 x2 xn,ki为小于为小于xi+1的样的样本值出现的累积频次,本值出现的累积频次,n仍为样本容量,则可得到样本累仍为样本容量,则可得到样本累积频率分布函数如下积频率分布函数如下样本累积频率分布函数又简称为样本累积频率分布函数又简称为样本(累积)分布函数,它是总样本(累积)分布函数,它是总体(累积)分布函数的近似,体(累积)分布函数的近似,n越大,就越接近总体分布,如越大,就越接近总体分布,如图。图。第十三页,讲稿共九十一页哦对于有限总体,其累对于有限总体,其累积概率分布函数不连积概率分布函数不连续续,是阶跃式的。样本是阶跃式的。样本的累积分布函数也是的累积分布函数也是阶跃式的。如图所示。阶跃式的。如图所示。样本(累积)分布函数是总体(累积)分布函数的近似,样本(累积)分布函数是总体(累积)分布函数的近似,n越大,就越接近总体分布越大,就越接近总体分布第十四页,讲稿共九十一页哦1991年美国一般社会调查(1991U.S.GeneralSocialSurvey)数据中被调查对象”接受学校教育的最高年限”的样本累积分布图第十五页,讲稿共九十一页哦5.1.4格利文科(Glivenko)定理(样本分布与总体分布的关系)格利文科定理格利文科定理:当:当n趋于无穷大时,趋于无穷大时,Fn(x)依概率依概率1(关于(关于x)均匀地收敛于总体分布)均匀地收敛于总体分布F(x).格利文科定理的数学表达如下:格利文科定理的数学表达如下:格利文科定理是用样本特征推断总体特征的依据格利文科定理是用样本特征推断总体特征的依据。这表明当这表明当n充分大时,样本分布充分大时,样本分布Fn(x)是总体分布是总体分布F(x)的的一个良好近似。一个良好近似。第十六页,讲稿共九十一页哦例如,利用格利文科定理可以证明:例如,利用格利文科定理可以证明:即样本均值依概率收敛于总体均值。即样本方差依概率收敛于总体方差。第十七页,讲稿共九十一页哦5.1.5随机样本的均值函数对于随机样本对于随机样本X1,X2,Xn,定义样本的定义样本的均值函数均值函数(简称为(简称为样本均值样本均值)为)为由于式中由于式中Xi是随机样本(随机变量),因此作为是随机样本(随机变量),因此作为随机样本函数的随机样本函数的 是随机变量是随机变量比较样本数据的均值比较样本数据的均值它可以看成是它可以看成是 的观察值的观察值第十八页,讲稿共九十一页哦5.1.6随机样本的方差函数对于随机样本对于随机样本X1,X2,Xn,定义样本的定义样本的方差函数方差函数(简称为(简称为样本方差样本方差)为)为由于式中由于式中Xi是随机样本(随机变量),因此作为随是随机样本(随机变量),因此作为随机样本函数的机样本函数的S2是随机变量是随机变量比较样本数据的方差比较样本数据的方差它是它是S2的观察值的观察值第十九页,讲稿共九十一页哦5.2统计量与统计量的分布5.2.1 统计量的定义统计量的定义统计量统计量是不含未知参数的、随机样本是不含未知参数的、随机样本X1,X2,Xn的的函数函数注意统计量是随机样本注意统计量是随机样本X1,X2,Xn的函数,因而也是的函数,因而也是随机变量随机变量在上面定义的函数中将每个随机样本在上面定义的函数中将每个随机样本Xi用其观察值用其观察值xi代代替,计算的结果替,计算的结果f(x1,x2,xn)称为称为统计量的值。统计量的值。也也可以直接将可以直接将f(x1,x2,xn)看成统计量的观察值。看成统计量的观察值。第二十页,讲稿共九十一页哦例子例如一项关于浙江省白领(收入为4000元-10000元)的职员的调查认为有60%白领患失眠症。样本1样本2样本3如果在这个调查中样本容量为100,则=(样本中失眠的人数)/(样本容量)是一个统计量。第二十一页,讲稿共九十一页哦1.是某一样本统计量的全部可能取值的概率分布。是某一样本统计量的全部可能取值的概率分布。2.现实中不可能抽出所有样本,因此统计量的抽现实中不可能抽出所有样本,因此统计量的抽样分布实际是一种理论概率分布。统计推断中,样分布实际是一种理论概率分布。统计推断中,常用的理论概率分布:正态分布、常用的理论概率分布:正态分布、2分布、分布、t分布和分布和F分布。分布。3.提供了样本统计量稳定的信息,是进行推断的提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。理论基础,也是抽样推断科学性的重要依据。样本分布样本分布(sampling distribution)第二十二页,讲稿共九十一页哦5.2.2由标准正态分布的随机样本所引出的几个重要统计量的分布1.正态分布与标准正态分布正态分布与标准正态分布设设X服从均值为服从均值为,方差为,方差为2正态分布正态分布,即,即 X N(,2),则其分布密度函数为,则其分布密度函数为特别地,当特别地,当=0,2=1 时时正态分布称为正态分布称为标准正态分标准正态分布布。第二十三页,讲稿共九十一页哦任何一个正态分布XN(,2),作变换就可化成标准正态分布,即ZN(0,1)。正态分布有许多特点:例如它是对称的。正态变量大约有68%的可能性在离均值一个标准差的范围内取值;大约有95%的可能性在离均值1.96倍标准差的范围内取值。几乎不在离均值3倍标准差以外的地方取值。68%95%99.7%第二十四页,讲稿共九十一页哦例如设XN(54,0.852),要计算P(X52)。则可以这样计算:第二十五页,讲稿共九十一页哦x0.000.010.020.030.040.050.060.070.080.090.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.90.50000.53980.57930.61790.65540.69150.72570.75800.78810.81590.84130.86430.88490.90320.91920.93320.94520.95540.96410.97130.97720.98210.98610.98930.99180.99380.99530.99650.99740.99810.50400.54380.58320.62170.65910.69500.72910.76110.79100.81860.84380.86650.88690.90490.92070.93450.94630.95640.96480.97190.97780.98260.98640.98960.99200.99400.99550.99660.99750.99820.50800.54780.58710.62550.66280.69850.73240.76420.79390.82120.84610.86860.88880.90660.92220.93570.94740.95730.96560.97260.97830.98300.98680.98980.99220.99410.99560.99670.99760.99820.51200.55170.59100.62930.66640.70190.73570.76730.79670.82380.84850.87080.89070.90820.92360.93700.94840.95820.96640.97320.97880.98340.98710.99010.99250.99430.99570.99680.99770.99830.51600.55570.59480.63310.67000.70540.73890.77030.79950.82640.85080.87290.89250.90990.92510.93820.94950.95910.96710.97380.97930.98380.98740.99040.99270.99450.99590.99690.99770.99840.51990.55960.59870.63680.67360.70880.74220.77340.80230.82890.85310.87490.89440.91150.92650.93940.95050.95990.96780.97440.97980.98420.98780.99060.99290.99460.99600.99700.99780.99840.52390.56360.60260.64060.67720.71230.74540.77640.80510.83150.85540.87700.89620.91310.92780.94060.95150.96080.96860.97500.98030.98460.98810.99090.99310.99480.99610.99710.99790.99850.52790.56750.60640.64430.68080.71570.74860.77940.80780.83400.85770.87900.89800.91470.92920.94180.95250.96160.96930.97560.98080.98500.98840.99110.99320.99490.99620.99720.99790.99850.53190.57140.61030.64800.68440.71900.75170.78230.81060.83650.85990.88100.89970.91620.93060.94300.95350.96250.97000.97620.98120.98540.98870.99130.99340.99510.99630.99730.99800.99860.53590.57530.61410.65170.68790.72240.75490.78520.81330.83890.86210.88300.90150.91770.93190.94410.95450.96330.97060.97670.98170.98570.98900.99160.99360.99520.99640.99740.99810.9986第二十六页,讲稿共九十一页哦2.2(n)分布的构成分布的构成设设X N(0,1),X1,X2,Xn是是X的随机样本,则这些的随机样本,则这些随机样本的平方和随机样本的平方和服从自由度为服从自由度为n的的 2分布,即分布,即 2 2(n)这是一种常用的分布。例如对服从正态分布的变量的随机样本,其方差函数S2就满足:第二十七页,讲稿共九十一页哦 2(n)一个非对称分布,其均值为一个非对称分布,其均值为n,方差为,方差为2n,其中,其中n为为自由度自由度(df)。第二十八页,讲稿共九十一页哦3.t分布分布自由度为自由度为n的的t分布,记为分布,记为t(n),是由标准正态分布是由标准正态分布N(0,1)和和 2(n)分布组成分布组成,其表达式为其表达式为其中其中X N(0,1),Y 2(n),且且X与与Y相互独立。相互独立。第二十九页,讲稿共九十一页哦t分布的均值为分布的均值为0,方差为,方差为n/(n-2)。并且当。并且当n充分大时,它就充分大时,它就近似于标准正态分布。近似于标准正态分布。第三十页,讲稿共九十一页哦4.F分布分布F分布分布是由两个是由两个 2之比组成的:之比组成的:记为记为FF(n,m),其中其中U 2(n),V 2(m).对于对于 F(n,m),n称称为第一自由度(分子自由度),为第一自由度(分子自由度),m称为第二自由度(分母称为第二自由度(分母自由度)。自由度)。第三十一页,讲稿共九十一页哦第三十二页,讲稿共九十一页哦5.2.3由一般正态分布的随机样本所构成的若干重要统计量的分布抽样分布:样本统计量所抽样分布:样本统计量所有可能值的概率分布。有可能值的概率分布。样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量分布的形分布的形状及接近状及接近总体参数总体参数的程度的程度第三十三页,讲稿共九十一页哦样本统计量样本统计量:平均数平均数比率(成数)比率(成数)方差方差第三十四页,讲稿共九十一页哦设随机变量设随机变量X N(,2),X1,X2,Xn是是X的随机样本,的随机样本,则则(1)(2)(3)常使用的几个样本统计量及其分布常使用的几个样本统计量及其分布第三十五页,讲稿共九十一页哦(4)(5)其中其中 是容量为是容量为n1的随机变量的随机变量 的的样本方差;样本方差;是容量为是容量为n2的随机变量的随机变量 的样本方差。的样本方差。第三十六页,讲稿共九十一页哦5.2.4任意分布的随机样本均值函数的均值和方差设随机变量设随机变量X 的均值为的均值为,方差为方差为2,而分布形式任意,而分布形式任意,X1,X2,Xn是是X的随机样本,则的随机样本,则(1)(2)也就是任意随机变量的样本均值就等于总体均值;样本也就是任意随机变量的样本均值就等于总体均值;样本方差等于总体方差与样本容量的商方差等于总体方差与样本容量的商第三十七页,讲稿共九十一页哦5.2.5大样本均值的分布:中心极限定理设随机变量设随机变量X 服从均值为服从均值为,方差为方差为2 的分布的分布,X1,X2,Xn是是X的随机样本,则有如下的中心极限定理。的随机样本,则有如下的中心极限定理。中心极限定理中心极限定理(Central Limit Theorem):当:当n充分大充分大时,近似地有时,近似地有一般地,当一般地,当n 30时,就可应用中心极限定理了。时,就可应用中心极限定理了。或者近似地有或者近似地有或者近似地有第三十八页,讲稿共九十一页哦样本容量样本容量样本容量:一个样本中包样本容量:一个样本中包含的样本单位数。通常用含的样本单位数。通常用n来来表示。表示。大样本:大样本:n30小样本:小样本:n 30第三十九页,讲稿共九十一页哦学生学生成绩成绩 30 40 50 60 70 80 90按随机原则抽选出名学生,按随机原则抽选出名学生,并计算平均分数。并计算平均分数。平均数的抽样分布平均数的抽样分布样本样本均值均值样本样本 均值均值样本样本均值均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值样本均值 45 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4 4 5样本均值样本均值 62.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 1二者均值相等二者均值相等第四十页,讲稿共九十一页哦第四十一页,讲稿共九十一页哦则容易得到利用上述结果与5.2.2的结果只要能够证明第四十二页,讲稿共九十一页哦例 一汽车蓄电池商声称其生产的电池具有均值为54个月、标准差为6个月的寿命分布。现假设某消费者团体决定检验该厂的说法是否准确,为此购买了50个该厂的电池进行检验。1)假定厂商的声称是正确的,试描述这50个电池平均寿命的抽样分布。2)假定厂商声称正确,则50个样品组成的样本的平均寿命不超过52个月的寿命的概率是多少?解1)由中心极限定理,样本均值近似服从正态分布而并且故第四十三页,讲稿共九十一页哦2)按照上面得到的结果来计算这50个电池平均寿命不超过52个月的概率这表明这50个电池平均寿命不超过52个月的概率非常小。因此这种情况应该不太可能出现。如果出现该情况意味着什么?第四十四页,讲稿共九十一页哦5.3点估计在解决实际问题时,常常需要用样本来推断总体分布在解决实际问题时,常常需要用样本来推断总体分布的某些参数值,这就是所谓的的某些参数值,这就是所谓的参数估计参数估计。参数估计又分。参数估计又分为为点估计点估计与与区间估计区间估计。总体参数(parameter)为描述一个总体的数字,它往往刻画了总体某一方面的特征。总体参数是一个特定值(fixed number常数),但在现实中常常无法知道其确切的数值,例如总体的均值、方差,总体中某一类特定对象占的比例等。第四十五页,讲稿共九十一页哦一般地,一般地,估计量(统计量)是指的随机样本的一个函数估计量(统计量)是指的随机样本的一个函数。所以粗略地讲,点估计就是用样本的某一函数值,来估计所以粗略地讲,点估计就是用样本的某一函数值,来估计总体分布中的未知参数。而区间估计就是(以一定概率)总体分布中的未知参数。而区间估计就是(以一定概率)把总体分布的参数确定在由样本决定的某个区间内。把总体分布的参数确定在由样本决定的某个区间内。一个样本统计量(如样本均值)是样本的函数Population总体参数x4x49x103x354x41x4x42909x1005x31x411第四十六页,讲稿共九十一页哦5.3.1点估计的概念设设是总体分布中一个需要估计的参数。现在从总体中得是总体分布中一个需要估计的参数。现在从总体中得到一个随机样本到一个随机样本X1,X2,Xn,我们的目的是通过这一随,我们的目的是通过这一随机样本来估计参数机样本来估计参数。的估计量的估计量通常是随机样本通常是随机样本X1,X2,Xn的一个函数,的一个函数,记为记为简记为简记为若能够得到一组样本观察值若能够得到一组样本观察值x1,x2,xn,则将它们代入,则将它们代入上述函数,可以计算出上述函数,可以计算出的估计值的估计值的估计值也简记为的估计值也简记为 。的点估计就是求的点估计就是求的估计值的估计值第四十七页,讲稿共九十一页哦5.3.2矩估计法对总体而言,矩是指:对总体而言,矩是指:k阶原点矩阶原点矩 k阶中心矩(中心为阶中心矩(中心为)对样本而言对样本而言 一阶原点矩一阶原点矩 二阶中心矩二阶中心矩矩估计法就是用样本矩来估计相应的总体矩。矩估计法就是用样本矩来估计相应的总体矩。第四十八页,讲稿共九十一页哦例如通常例如通常用用 来估计来估计 用用 来估计来估计 并且称这样得到的估计量为并且称这样得到的估计量为矩估计量矩估计量。第四十九页,讲稿共九十一页哦5.3.3极大似然估计法引例引例 设甲乙两个盒子外形完全相同,甲盒中装有设甲乙两个盒子外形完全相同,甲盒中装有90个白个白球球10个黑球,乙盒中装有个黑球,乙盒中装有90个黑球个黑球10个白球。今随机个白球。今随机地抽取一个盒子并从中抽取一球,结果抽到白球,问地抽取一个盒子并从中抽取一球,结果抽到白球,问这球是从哪个盒子中抽取的?这球是从哪个盒子中抽取的?从甲盒中抽取一球是白球的概率从甲盒中抽取一球是白球的概率p1=9/10从乙盒中抽取一球是白球的概率从乙盒中抽取一球是白球的概率p2=1/10p1远大于远大于p2,因此我们推断这球是从甲盒中取出。,因此我们推断这球是从甲盒中取出。这个推断我们依据的是所谓这个推断我们依据的是所谓极大似然原理极大似然原理:如果进行如果进行一次随机实验,结果是若干个可能后果中的某一个出一次随机实验,结果是若干个可能后果中的某一个出现了,则可以认为实验的条件有利于该后果的出现,现了,则可以认为实验的条件有利于该后果的出现,即该后果出现的概率最大即该后果出现的概率最大。第五十页,讲稿共九十一页哦更一般地,如果用一个参数更一般地,如果用一个参数来表示不同的盒子,即来表示不同的盒子,即现在随机抽取一个盒子,然后随机独立有放回地抽现在随机抽取一个盒子,然后随机独立有放回地抽取取5次,每次抽取一个球。如果结果是黑、白、白、次,每次抽取一个球。如果结果是黑、白、白、白、黑。问白、黑。问等于等于0还是等于还是等于1?对于甲盒,得到这样结果的概率对于甲盒,得到这样结果的概率对于乙盒,得到这样结果的概率对于乙盒,得到这样结果的概率由于由于p1大于大于p2,因此我们推断,因此我们推断 =0。也就是,也就是,是使联合概率达到最大的数是使联合概率达到最大的数。第五十一页,讲稿共九十一页哦将上述问题抽象化。设将上述问题抽象化。设X是一个随机变量,其概率密是一个随机变量,其概率密度函数为度函数为 。又设。又设X1,X2,Xn是是X的随机样本,的随机样本,则记联合密度函数为则记联合密度函数为称为称为的的极大似然函数极大似然函数。若得到一组样本观察值若得到一组样本观察值x1,x2,xn,则代入,则代入L后得到一后得到一个关于个关于的函数。如果存在的函数。如果存在 使函数使函数L取最大值。则称该取最大值。则称该 为为的的极大似然估计值极大似然估计值。而称。而称为为的的极大似然估计量极大似然估计量。第五十二页,讲稿共九十一页哦5.3.4示例例例5.3.1 设随机变量设随机变量X 服从均值为服从均值为,方差为方差为2 的正态分的正态分布布,X1,X2,Xn是是X的随机样本,求的随机样本,求和和2的极大似然的极大似然估计量。估计量。首先由前面的讨论可知极大似然函数为首先由前面的讨论可知极大似然函数为第五十三页,讲稿共九十一页哦对对L取极大值等价于对取极大值等价于对L的对数取极大值的对数取极大值。因此在。因此在L取对取对数后,再分别计算关于数后,再分别计算关于和和2的偏导数,并令偏导数为零,的偏导数,并令偏导数为零,解得解得和和2的估计量分别为的估计量分别为2的极大似然估计量要小于其矩估计量第五十四页,讲稿共九十一页哦例:英语六级未通过率假设某财经大学的学生在毕业时尚未通过六级的比率为p,现从中随机抽取100人调查其档案,发现其中有10人六级没过,试用极大似然法估计总体参数未通过六级的比例p。解用X表示任意抽取的一个毕业生六级通过的情况:X=1,若该生通过了六级0,若该生未通过六级则XB(1,p).于是对于x=0,1,有P(X=x)=px(1 p)1 x 第五十五页,讲稿共九十一页哦英语六级未通过率对于来自于总体X的100个样本观测值x1,x2,x100,其中恰好有10个取值为1,其他为零。样本观察值的联合分布密度(似然函数)为两边取对数得对数似然函数为:上式关于p求导数并令导数为0,解得:其中q=1 p.注:用矩估计法可得到同样结果第五十六页,讲稿共九十一页哦5.4判断点估计量的优劣标准问题:问题:第一,我们为什么以这一个而不第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数是那一个统计量来估计某个总体参数?第二,如果有两个以上的统计量第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优结果是否一致?是否一个统计量要优于另一个?于另一个?估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性第五十七页,讲稿共九十一页哦5.4.1 无偏估计量无偏估计量设设 为为的估计量。如果的估计量。如果 则称则称 为为的无偏估计量。的无偏估计量。第五十八页,讲稿共九十一页哦对于正态总体,可以证明对于正态总体,可以证明总体均值的样本矩估计量(同时也是极大似总体均值的样本矩估计量(同时也是极大似然估计量)然估计量)是无偏的。是无偏的。总体方差的样本矩估计量总体方差的样本矩估计量S2是无偏的,但是极是无偏的,但是极大似然估计量是有偏的。大似然估计量是有偏的。第五十九页,讲稿共九十一页哦5.4.2最小方差性在一个参数的众多估计量中,人们偏好于那些具有较小方差的估计量。因为由它给出的估计值可能与真实值有更小的误差。的分布函数的分布函数的分布函数的分布函数第六十页,讲稿共九十一页哦若总体参数为,的估计量 的方差 小于等于其他所有对估计量的方差,也就是总是成立,那么称的估计量具有最小方差性。第六十一页,讲稿共九十一页哦5.4.3有效估计量在用估计量在用估计量 来估计总体的某个参数时,来估计总体的某个参数时,如果如果(1)估计量估计量 无偏的;无偏的;(2)在在 的所有估计量中估计量的所有估计量中估计量 的方的方差最小差最小。那么,这个估计量那么,这个估计量 就是总体参数就是总体参数 的有的有效估计量。效估计量。第六十二页,讲稿共九十一页哦5.4.4渐近无偏估计量渐近无偏估计量是指满足如下条件的估计渐近无偏估计量是指满足如下条件的估计量:量:其中其中n为样本容量。为样本容量。第六十三页,讲稿共九十一页哦5.4.5一致估计量第六十四页,讲稿共九十一页哦一致估计量的另一种等价的定义是:一致估计量的另一种等价的定义是:(1)是渐近无偏的;是渐近无偏的;(2)其中(其中(2)中的极限为所谓的渐近方差)中的极限为所谓的渐近方差而普通方差为而普通方差为第六十五页,讲稿共九十一页哦通常判别点估计量优劣的准则小样本准则小样本准则无偏性无偏性有效性有效性大样本准则大样本准则一致性一致性第六十六页,讲稿共九十一页哦可以证明下列估计量是具有较好统计性质的估计量总体均值的矩估计量总体方差的矩估计量总体方差的极大似然估计量总体比例p的估计量样本比例第六十七页,讲稿共九十一页哦总体构成比例的估计常常可能会关注总体中某一类特定对象占的比例p。对于这样的问题,可以采用如下的方式处理。在总体中任取一个个体,用一个变量X来描述所抽取的对象是否属于所关注的对象这一事件,即X=1,若抽得的是所关注的对象0,若抽得的不是所关注的对象于是,该总体可以用服从0-1分布的随机变量X B(1,p)描述,其中p表示所关注的对象在总体中占的比例。对于0-1分布B(1,p),其数学期望值与方差分别为:p,p(1 p)第六十八页,讲稿共九十一页哦设X1,X2,Xn是来自于总体X的一个随机样本,并且在这一样本中我们所关注的对象恰好出现了n1次。那么即样本的均值恰好等于样本的比例。由此可见,可用样本比例 来估计总体比例p。此外,由中心极限定理,当样本容量充分大时,样本的均值函数近似地服从正态分布,也就是近似地有:第六十九页,讲稿共九十一页哦点估计的最大好处:给出确定的点估计的最大好处:给出确定的估计值估计值点估计的最大问题:无法控制误点估计的最大问题:无法控制误差及判断可靠程度差及判断可靠程度在实际应用中,我们通常只取一个样本,因此我们无法知道通过这个样本对总体参数的估计是否精确。但样本容量大的随机样本通常总是给出更接近总体参数的估计值。第七十页,讲稿共九十一页哦5.5区间估计在用样本均值估计总体均值时,总有人会问:“这一估计有多好?”这意味着人们不但关注你给出的估计值是多少,还关注你给出的估计有多大的误差和可靠程度。例如一家商店调查顾客的满意度,随机抽取了由100个顾客组成的样本,然后请这些顾客回答对商店服务的满意度得分,最低(最不满意)0分,最高100分。调查结果,这100个顾客给出的满意度平均分80分。问题“这一估计有多好这一估计有多好?”具体来说就是,这是否体现了所有顾客对商店满意的平均程度,有多大误差,样本数量是否足够等。第七十一页,讲稿共九十一页哦5.5.1 置信区间置信区间若总体分布含一个未知参数若总体分布含一个未知参数,如果找出了如果找出了2个依赖样本个依赖样本X1,X2,Xn的估计量:的估计量:使得使得其中其中0 1,则则称随机区称随机区间间 为为的的(1 )(或(或100(1 )%)的)的置信区间置信区间;(1 )(或(或百分数百分数100(1 )%)称为)称为置信度置信度或或置信水平置信水平;称为称为显著性水平显著性水平,通常取为通常取为0.05,0.10或或0.01。参数的区间估计就是求参。参数的区间估计就是求参数的置信区间。数的置信区间。第七十二页,讲稿共九十一页哦5.5.2 已知总体方差求总体均值已知总体方差求总体均值的置信区间的置信区间 设总体设总体X服从服从N(,0.09),抽取了抽取了4个样本观察值个样本观察值x1,x2,x3,x4,求总体均值求总体均值的的95%的置信区间。的置信区间。首先首先因此因此注意到注意到N(0,1)是一个对称分是一个对称分布。给定概率值布。给定概率值0.95,现在,现在来确定常数来确定常数k,使得,使得2.5%的的面积面积95%的面积的面积k第七十三页,讲稿共九十一页哦利用书末的附表一,可以查得利用书末的附表一,可以查得k=z0.025=1.96。于是下。于是下面的不等式成立的概率为面的不等式成立的概率为0.95这等价于这等价于将将z0