《数理统计的基本概念解析学习教案.pptx》由会员分享,可在线阅读,更多相关《数理统计的基本概念解析学习教案.pptx(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计数理统计(sh l tn j)的基本概念解析的基本概念解析第一页,共68页。前面五章我们讲述了概率论的基本内容,随后的四章将讲述数理统计数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断 数理统计的内容包括:如何收集、整理数据资料;如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断后者就是(jish)我们所说的统计推断问题。本书只讲述统计推断的基本内容。本章我们介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布第1页/共68页第二页,共68页。
2、第一节第一节 总体总体(zngt)(zngt)与样本与样本 我们知道,虽然从理论(lln)上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有的甚至是少量的 因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论第2页/共68页第三页,共68页。例如,我们考察某厂生产(shngchn)的电视机显像管的质量,在正常生产(shngchn)情况下,显像管的质量主要表现为它们的平均寿命是稳定的 然而,由于生产(shngchn)中各种随机因素的影响,各个显像管的寿命是不完全相同的 因为
3、受到人力、物力等的限制,特别是测定显像管寿命这类的试验具有破坏性,所以我们不可能对生产(shngchn)的全部显像管一一进行测试,一般只是从整批显像管中取出一些显像管来测试,然后根据得到的这些显像管寿命的数据来推断整批显像管的平均寿命 第3页/共68页第四页,共68页。我们把被研究的对象的全体称为总体(或母体),而我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体把组成总体的各个元素称为个体在上面的例子中,该厂生产的所有显像管的寿命就是在上面的例子中,该厂生产的所有显像管的寿命就是总体,而每一个显像管的寿命就是个体总体,而每一个显像管的寿命就是个体代表代表(dibio)
4、(dibio)总体的指标(如显像管的寿命)是一总体的指标(如显像管的寿命)是一个随机变量,所以总体就是指某个随机变量可能取的值的全个随机变量,所以总体就是指某个随机变量可能取的值的全体体 第4页/共68页第五页,共68页。从总体中抽取一个个体,就是对代表总体的随机变从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或量进行一次试验(或观测),得到的一个试验数据(或观测值)观测值)从总体中抽取一部分个体,就是对随机变量进行若从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)干次试验(观测)从总体中抽取若干个个体的过程称为抽样从总体中抽取若干个个体
5、的过程称为抽样抽样结果得到的一组试验数据(观测值),称为样抽样结果得到的一组试验数据(观测值),称为样本本(yngbn)(yngbn)(或子样);(或子样);样本样本(yngbn)(yngbn)中所含个体的数量称为样本中所含个体的数量称为样本(yngbn)(yngbn)容量容量 第5页/共68页第六页,共68页。假设满足下述两个条件:(1)随机性 为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现(2)独立性 各次抽样必须是相互(xingh)独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽
6、样结果的影响 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本第6页/共68页第七页,共68页。例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本 从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽样,但是正如在前面我们已知的,若总体容量 很大而样本容量 较小(),则可以 近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本 第7页/共68页第八页,共68页。今后,凡是提到抽样与样本,都是指简单随机抽样与简今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本单随
7、机样本 我们指出,从总体中抽取容量我们指出,从总体中抽取容量(rngling)(rngling)为为n n的样本,的样本,就是对代表总体的随机变量随机地、独立地进行就是对代表总体的随机变量随机地、独立地进行n n次试验次试验(观测),每次试验的结果可以看作是一个随机变量,(观测),每次试验的结果可以看作是一个随机变量,次试验的结果就是次试验的结果就是n n个随机变量个随机变量 ,今后,凡是提到抽样与样本,都是指简单随机今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本抽样与简单随机样本 我们指出,从总体中抽取容量为我们指出,从总体中抽取容量为n n的样本,就是的样本,就是(jish)(
8、jish)对代表总体的随机变量随机地、独立对代表总体的随机变量随机地、独立地进行地进行n n次试验(观测),每次试验的结果可以次试验(观测),每次试验的结果可以看作是一个随机变量,次试验的结果就是看作是一个随机变量,次试验的结果就是(jish)n(jish)n个随机变量个随机变量 ,第8页/共68页第九页,共68页。若将样本若将样本 ,看作是一个维随机变量看作是一个维随机变量 ,则则 (1)(1)当总体当总体 是离散是离散(lsn)(lsn)型随机变量型随机变量,若记其分若记其分布率为布率为 ,则样本则样本的分布律为:的分布律为:(2)当总体 是连续型随机变量(su j bin lin),若记
9、其概率密度为 ,则样本 的联合概率密度为:第9页/共68页第十页,共68页。1.设 是来自两点分布总体 的样本,的分布为:求样本分布律。2.设有 个产品,其中有 个次品,个正品,进行放回抽样,定义 如下:求样本 的分布律。习题(xt)6-1第10页/共68页第十一页,共68页。4.4.设某种电灯泡的寿命设某种电灯泡的寿命 服从服从(fcng)(fcng)指数分布,求来指数分布,求来自这一总体的简单随机样本自这一总体的简单随机样本 的联合概率的联合概率密度。密度。5.5.设设 是来自均匀分布总体是来自均匀分布总体 的样本,求的样本,求样本的联合概率密度。样本的联合概率密度。第11页/共68页第十
10、二页,共68页。第二节第二节 样本分布函数样本分布函数(hnsh)(hnsh)直方图直方图一、样本分布函数(hnsh)我我们们把把总总体体的的分分布布函函数数 称称为为总总体体分分布布函函数数.从从总总体体中中抽抽取取容容量量(rngling)(rngling)为为n n的的样样本本得得到到n n个个样样本本观观测测值值,若若样样本本容容量量(rngling)n(rngling)n较较大大,则则相相同同的的n n观观测测值值可可能能重重复复出出现现若若干干次次,为为此此,应应当当把把这这些些观观测测值值整整理理,并并写写出出下下面面的的样样本本频频率率分分布表:布表:第12页/共68页第十三页
11、,共68页。观测值 总计 频 数 频 率 1其中第13页/共68页第十四页,共68页。定义定义定义定义(dngy)(dngy)设设设设函数函数函数函数 定义定义 设函数 (2)是非减函数 (1)第14页/共68页第十五页,共68页。(3)(4)在每个观测值 处是右连续的,点 是 的跳跃间断点,在该点的跃度就等于频率样本分布函数 的图形如图6-1所示图6-1第15页/共68页第十六页,共68页。对于任意的实数 总体分布函数 是事件 的概率;样本分布函数 是事件 发生的频率根据伯努利大数定理可知,当 时,对于任意的正数 ,有 对于任意的实数对于任意的实数 总体总体(zngt)(zngt)分布函数分
12、布函数 是是事件事件 的概率;样本分布函数的概率;样本分布函数 是事件是事件 发生的频率根据伯努利大数定理可知发生的频率根据伯努利大数定理可知,当当 时,对于任意的正数时,对于任意的正数 ,有,有第16页/共68页第十七页,共68页。二、直方图二、直方图 数理统计中研究连续随机变量 的样本分布时,通常需要作出样本的频率直方图(简称直方图),作直方图的步骤如下:1.1.找出样本观测找出样本观测(gunc)(gunc)值值 中的中的最小值与最大值最小值与最大值,分别记作分别记作 与与 ,即,即1.1.找出样本观测找出样本观测(gunc)(gunc)值值 中中的最小值与最大值的最小值与最大值,分别记
13、作分别记作 与与 ,即,即第17页/共68页第十八页,共68页。此外,为了方便起见,分点 应比样本观测值 多取一位小数。各子区间的长度可以相等,也可以不等;若使各子区间的长度相等,则有子区间(q jin)的个数一般取为8至15个,太多则由于频率的随机摆动而使分布显得杂乱,太少则难于显示分布的特征。3.把所有样本观测值逐个分到各子区间内,并计算样本观测值落在各子区间内的频数 及频率第18页/共68页第十九页,共68页。4.在 轴上截取各子区间,并以各子区间为底,以 为高作小矩形,各个小矩形的面积就等于样本观测值落在该子区间内的频率,即所有小矩形的面积的和这样作出的所有(suyu)小矩形就构成了直
14、方图。因为样本容量 充分大时,随机变量 的取值落在各个子区间 内的频率近似等于其概率 即 所以直方图大致地描述了总体 的概率分布。第19页/共68页第二十页,共68页。例例 测量测量100100个某种机械零件的质量,得到样本观测个某种机械零件的质量,得到样本观测(gunc)(gunc)值如下(单位:值如下(单位:g g)246 251 259 254 246 253 237 252 250 251 246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 249 244 249 244 243
15、 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253
16、 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258
17、 247 252 264 248 244 254 247 252 257 258 247 252 264 248 244写出零件质量的频率分布表并作直方图。写出零件质量的频率分布表并作直方图。第20页/共68页第二十一页,共68页。解因为(yn wi)样本观测中最小值为237,最大值为265,所以我们把数据(shj)的分布区间确定为(236.5,266.5)并把这个(zh ge)区间等分为10个子区间(236.5,239.5),(239.5,242.5),(263.5,266.5)由此得到零件质量的频率分布表:零件质量/频数 频率 236.5239.5 1 0.01 239.5242.5 5
18、0.05 242.5245.5 9 0.09 245.5248.5 19 0.19 248.5251.5 24 0.24 251.5254.5 22 0.22 254.5257.5 11 0.11 257.5260.5 6 0.06 260.5263.5 1 0.01 263.5266.5 2 0.02 总计 100 1.00第21页/共68页第二十二页,共68页。直方图如图直方图如图6 62 2所示所示图62第22页/共68页第二十三页,共68页。习题习题(xt)6(xt)62 21.某射手进行20次独立、重复的射击,击中靶子的环数如下表:环数 4 5 6 7 8 9 10 频数 2 0 4
19、 9 0 3 2 求经验分布函数 ,并作图。第23页/共68页第二十四页,共68页。2.测得20个毛坯重量(单位:g),列成简单表如下:毛坯重量 185 187 192 195 200 202 205 206 频数 1 1 1 1 1 2 1 1 毛坯重量 207 208 210 214 215 216 218 227 频数 2 1 1 1 2 1 2 1将其按区间(183.5,192.5),(219.5,228.5)为5组,列出毛坯重量的频率分布表,并作直方图。第24页/共68页第二十五页,共68页。第三节第三节 样本函数样本函数(hnsh)(hnsh)与统计量与统计量 为了通过对样本观测值
20、的整理、分析、研究,对总体 的某些概率特征作出推断,往往需要考虑各种适用的样本函数 因为一组样本 可以看作是一个 维随机变量 所以任何样本函数 都是 维随机变量的函数,为了通过对样本观测值的整理、分析为了通过对样本观测值的整理、分析(fnx)(fnx)、研、研究,对总体究,对总体 的某些概率特征作出推断,往往需要考的某些概率特征作出推断,往往需要考虑各种适用的样本函数虑各种适用的样本函数 因为一组样本因为一组样本 可以看作是一个可以看作是一个 维随机变维随机变量量 所以任何样本函数所以任何样本函数 都是都是 维随机变量的函数维随机变量的函数,第25页/共68页第二十六页,共68页。1.样本均值
21、 (1)观测值记为 (2)2.样本方差 (3)观测值记为 (4)数理统计中最常用(chn yn)的统计量及其观测值有:第26页/共68页第二十七页,共68页。3.样本标准差 (5)它的观测值记为 (6)4.样本k 阶原点矩 (7)它的观测值记为 (8)显然,样本的一阶原点矩就是样本均值。第27页/共68页第二十八页,共68页。5.5.样本样本k k阶中心矩阶中心矩 (9)(9)它的观测值记为它的观测值记为 (10)(10)显然,样本一阶中心矩恒等于零。显然,样本一阶中心矩恒等于零。当样本容量当样本容量 较大时,相同的样本观测值较大时,相同的样本观测值 往往往可能重复出现往可能重复出现(chxi
22、n)(chxin),为了使计算简化,为了使计算简化,应先把所得的数据整理,设得到下表:应先把所得的数据整理,设得到下表:第28页/共68页第二十九页,共68页。观测值 总计 频数 其中 .于是样本均值 ,样本方差样本二阶中心矩 可以分别按下列公式计算:(11)(12)(13)第29页/共68页第三十页,共68页。若总体 的 阶矩 存在独立且与 同分布。故有与样本二阶中心矩显然,当样本容量 充分大时,样本方差是近似相等的则当 时独立且与X同分布,所以因为第30页/共68页第三十一页,共68页。进而由第五章中关于依概率收敛的序列(xli)的性质知道其中 为连续函数,这就是下一章所要介绍的矩估计法的
23、理论根据。从而由第五章的大数(d sh)定理知第31页/共68页第三十二页,共68页。习题习题(xt)6(xt)63 31.1.从从某某工工人人生生产产的的铆铆钉钉中中随随机机抽抽取取5 5只只,测测得得其其直直径径(zhjng)(zhjng)分别为(单位:分别为(单位:mmmm):):13.7 13.08 13.11 13.11 13.13 13.7 13.08 13.11 13.11 13.13(1 1)写出总体、样本、样本值、样本容量)写出总体、样本、样本值、样本容量(2 2)求样本观测值的均值、方差。)求样本观测值的均值、方差。2 2设抽样得到样本观测值为设抽样得到样本观测值为 38.
24、2 38.2 40.2 40.2 42.4 42.4 37.6 37.6 39.2 39.2 41.0 41.0 44.0 44.0 43.2 43.2 38.8 40.6 38.8 40.6 计算样本均值、样本标准差、样本方差与样本二计算样本均值、样本标准差、样本方差与样本二阶中心矩。阶中心矩。第32页/共68页第三十三页,共68页。3设抽样得到100个样本观测值如下:观测值 1 2 3 4 5 6 频数 15 21 25 20 12 7计算样本均值、样本方差与样本二阶中心矩。4设 ,为 的样本均值与样本方差.作数据变换:设 ,为 的样本均值与样本方差,证明(1)(2)第33页/共68页第三
25、十四页,共68页。5.从总体中抽取两组样本,其容量分别为 及 ,设两组的样本均值分别为 及 样本方差分别为 及 ,把这两组样本合并为一组容量为 的联合样本,证明:(1)联合样本的样本均值 (2)联合样本的样本方差 第34页/共68页第三十五页,共68页。第四节第四节 抽样抽样(chu yn)(chu yn)分布分布 统计量的分布称为抽样分布。统计量的分布称为抽样分布。在使用在使用(shyng)(shyng)统计量进行统计推断时常需知道它统计量进行统计推断时常需知道它的分布的分布.当总体的分布函数已知时,抽样分布是确定的,然而要当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布
26、,一般来说是困难的求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用统计量的分布本节介绍来自正态总体的几个常用统计量的分布.今后,我们将看到这些分布在数理统计中有重要的应今后,我们将看到这些分布在数理统计中有重要的应用用.第35页/共68页第三十六页,共68页。一、三个重要一、三个重要一、三个重要一、三个重要(zhngyo)(zhngyo)分布分布分布分布为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计量中的三个重要分布,即 分布,分布,分布。1.分布设 是来自总体 的样本,则称统计量 (1)服从自由度为 的 分布,记为第36页/共68页第三十七页,共68页。此处,
27、自由度是指(1)式右端包含独立(dl)变量个数分布(fnb)的概率密度为的图形(txng)如图63所示。(2)第37页/共68页第三十八页,共68页。图6-3第38页/共68页第三十九页,共68页。此结论可推广:设 且相互独立分布的可加性分布的可加性设,并且 独立,则(证明(zhngmng)略)则第39页/共68页第四十页,共68页。若 ,则有分布的数学期望和方差因故因此又所以 也相互独立由于 相互独立于是第40页/共68页第四十一页,共68页。则称点 为 的上 分位点分布的分位点定义 设有分布函数 ,若对给定的有(6)当 有密度函数 时,式(6)可写成(7)由上述定义得 分布的上 分位点为(
28、8)第41页/共68页第四十二页,共68页。如图6-4所示,对于不同的 上 分位点的值已制成表格,可以查用(参见附表4)。图6-4第42页/共68页第四十三页,共68页。例如例如 对于对于 ,查得,查得但该表只详列到但该表只详列到 费歇(费歇(R.A.FisherR.A.Fisher)曾)曾证明,当证明,当 充分充分(chngfn)(chngfn)大时,近似地有大时,近似地有 (9 9)其中其中 是标准正态分布的上是标准正态分布的上 分位点。利用(分位点。利用(8 8)式)式可以求得当可以求得当 时,时,分布的上分布的上 分位点的近似值分位点的近似值例如由(9)式可得 (由更详细的表得 )第4
29、3页/共68页第四十四页,共68页。2.2.分布分布设 ,且 独立服从自由度为 的 分布则称随机变量(10)记为分布又称为学生氏(student)分布分布的概率密度函数为(11)第44页/共68页第四十五页,共68页。图6-5中画出了 的图形 的图形关于 对称,当 充分大时,其图形类似于标准正态变量概率密度的图形。事实上,利用 函数的性质可得 故当 足够大时,分布近似于 分布。但对于较小的 ,分布与 分布相差较大(见附表3 与附表2)(12)第45页/共68页第四十六页,共68页。图6-5第46页/共68页第四十七页,共68页。的点 为 分布的上 分位点.(见图6-6)分布的分位点对于给定的
30、,称满足条件(13)图6-6第47页/共68页第四十八页,共68页。由 分布上 分位点的定义及 图形的对称性知在 时,对于常用的 的值,就用正态近似(14)分布的上 分位点可自附表查得.(15)第48页/共68页第四十九页,共68页。3.3.分布分布(fnb)(fnb)设且 独立,则称随机变量服从自由度为 的 分布记为(16)的概率密度为(17)第49页/共68页第五十页,共68页。图6-7中画出了 的图形由定义可知,若 则 (18)图6-7第50页/共68页第五十一页,共68页。分布的分位点对于给定的 ,称满足条件(19)的点 为 分布的上 分位点(图6-8)图6-8第51页/共68页第五十
31、二页,共68页。容易证明等式:(20)利用(lyng)这个等式,查附录表,可以计算当时的 的值例如F分布(fnb)的上 分位点有表格可查(见附表 5)第52页/共68页第五十三页,共68页。二、正态总体统计二、正态总体统计二、正态总体统计二、正态总体统计(tngj)(tngj)量分布量分布量分布量分布 研究数理统计的问题时,往往需要知道所讨论的统计量 的分布一般说来,要确定某个统计量的分布是困难的,有的甚至是不可能的然而,对于总体服从正态分布的情形已经有了详尽的研究.下面我们讨论服从正态分布的总体的统计量的分布.假设 是来自正态总体 的样本,即它们是独立同分布的,皆服从 分布,样本(yngbn
32、)均值与样本(yngbn)方差分别是第53页/共68页第五十四页,共68页。定理1 设总体 服从正态分布 ,(21)即则 因为随机变量 相互独立且与总体 服从相同的正态分布 证所以(suy)由正态分布的性质(xngzh)可知,它们的线性组合服从正态分布即第54页/共68页第五十五页,共68页。这个定理的证明这个定理的证明(zhngmng)(zhngmng)从略,我们仅对自由从略,我们仅对自由度作一些说明度作一些说明定理2 设总体 服从正态分布 则(1)样本均值 与样本方差 相互独立;(2)统计量 服从自由度 的 分布即(22)第55页/共68页第五十六页,共68页。虽然是 个随机变量的平方和,
33、但是这些随机变量不是相互独立的。因为它们的和恒等于零:由样本方差 的定义易知所以(suy)统计量由于受到一个(y)条件的约束,所以自由度为第56页/共68页第五十七页,共68页。上述两定理是正态总体统计推断的基础,因而是上述两定理是正态总体统计推断的基础,因而是十分重要的,下面列举其应用十分重要的,下面列举其应用(有些结论(有些结论(jiln)(jiln)我们放在习题我们放在习题6-46-4中)中)第57页/共68页第五十八页,共68页。例1 设 是来自 的样本,则统计量(23)由定理1知,统计量又由定理2知,统计量因为 与 相互独立与 也相互独立所以证于是,由 分布的定义可知,统计量 第58
34、页/共68页第五十九页,共68页。例2 设 来自 ,是来自 的两个独立样本,记则统计量(24)第59页/共68页第六十页,共68页。由定理1可知,统计量证且 与 相互独立由正态分布的性质(xngzh)知即又由定理(dngl)2知:第60页/共68页第六十一页,共68页。因为 与 相互独立,与 相互独立所以统计量 与 也相互独立因为 与 相互独立,所以由 分布的可加性可知统计量于是,由 分布定义可知,统计量第61页/共68页第六十二页,共68页。由假设,相互独立,则由 分布的定义例3(续上例)记则(25)证由定理2知注:若两个正态分布的方差 与 不相等,则统计量第62页/共68页第六十三页,共6
35、8页。本节所介绍的几个分布本节所介绍的几个分布(fnb)(fnb)以及几个重要以及几个重要结论,在下面各章中都起着重要的作用。应注结论,在下面各章中都起着重要的作用。应注意,它们都是在总体为正态这一基本假定下得意,它们都是在总体为正态这一基本假定下得到的。到的。第63页/共68页第六十四页,共68页。习题习题(xt)6-4(xt)6-4服从自由度为 的 分布2设总体 服从正态分布 ,总体 服从正态分布 ,则统计量 1设总体 服从 分布,是已知常数 是来自总体 的一个容量为 的 简单随机样本,证明:统计量 服从自由度为n的 分布。2c c第64页/共68页第六十五页,共68页。3设 服从 分布,求下列随机变量的分布:4设 是独立且服从相同分布的随机 变量,且每一个 都服从(1)试给出常数 使得 服从 分布并指出它的自由度。(2)试给出常数 使得 服从 分布,并指出它的自由度。5查表求 第65页/共68页第六十六页,共68页。6设 ,求常数 ,使 7求总体 的容量分别为10,15的两独立样本均值差的绝对值大于0.3的概率。8设 为 的一个样本,求 9设在总体 中抽取一容量为16的样本,这里 均为未知,(1)求 ,其中 为样本方差,(2)求 第66页/共68页第六十七页,共68页。作业(zuy)第67页/共68页第六十八页,共68页。
限制150内