应用统计基本概念与抽样分布.pptx
《应用统计基本概念与抽样分布.pptx》由会员分享,可在线阅读,更多相关《应用统计基本概念与抽样分布.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布 例:某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作 第一,对生产出来的钢筋的强度进行检测,获得必要的数据。 第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。1.2 总体、个体、样本总体、个体、样本 1.2.1 总体与个体 我们把所研究对象的全体称为总体或母体。组成总体的每个单元称为个体 总体X可看作一个随机变量 ,称X的概率分布为总体分布,称X的数字特征为总体的数字特
2、征 ,对总体进行研究就是对总体的分布或对总体的数字特征进行研究 .1.2.2 样本 从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量 . 样本具有二重性:随机性和确定性 定义1.1 设总体X的样本满足 独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立; 代表性:样本中每一个个体都与总体X有相同分布。则称此样本为简单随机样本。 进行有放回抽样就是简单随机样本 ,无放回抽样就不是简单随机样本。但N很大,n相对较小时无放回抽样得到的样本可以近似看作简单随机样本. 称样本的分布为样本分布。如果 为简单随机样本, 为总体X的分布函数,则样本分布有比较简单的形
3、式 它完全由总体X的分布函数确定 12(,)nXXX( )F x 它完全由总体X的分布函数确定 ),(),221121nnnxXxXxXPxxxF(1122() ()()nnP Xx P XxP Xx1( )niiF x )(),(121ininxfxxxfininnpxXxXxXP12211),(两种形式例1.1 设有一批产品,其次品率为p,如果记“ ”表示抽取一件产品是次品;“ ” 表示抽取一件产品是正品;那么,产品的质量就可以用X的分布来衡量。X服从0-1分布,参数就是次品率p。如果为简单随机样本,求样本分布. 解:总体X的概率分布为 ,)1 ()(1 xxppxXP0X1X 12(,)
4、nXXX所以的概率分布为iixxninnppxXxXxXP112211)1 (),(niiniixnxpp11)1 ( 例1.2 设总体X服从参数为 的正态分布,求样本 的分布密度。 解:总体X的分布密度为所以 的概率分布为 2, 12(,)nXXX22)(21,21)(xexfx12(,)nXXX212211( ,)() exp() )22nnif x xxx 统计量统计量 统计量的定义 定义1.2 设 为总体X的一个样本, 为 的连续函数,且不含有任何未知参数,则称T为一个统计量。 注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值 ; 2.统计量是一
5、个随机变量,它将高维随机变量问题转化为一维随机变量来处理 ,但不会损失所讨论问题的信息量.12(,)nXXX12(,)nTT XXXnXXX,21常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩4.k 阶中心矩 5.顺序统计量6.样本极差 与中位数(1)(n)(k)最大顺序统计量:X最小顺序统计量:X第K顺序统计量:X 例1.3 设总体X为连续型的,求最大顺序统计量与最小顺序统计量的分布密度 . 解: 最大顺序统计量 的分布函数为 )(nX),()()(21)()(xXxXxXPxXPxFnnnninixFxXP)()(1 最小顺序统计量 的分布函数为)(1)()()1()1()1(
6、xXPxXPxF121(,)nP Xx XxXx ninixFxXP)(1 1)(11 如果总体中服从均匀分布则( )00( )01nnnxxFxxx(1)00()( )101nnxxFxxx 其分布密度为其它00)(1)(xnxxfnnn其它00)()(1)1(xxnxfnn充分统计量例:某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为 )外,其它都是合格品(记为 )。当厂长问及检查结果时检验员可作如下两种回答: (1) 10件中有两件不合格; (2) 前两件不合格。 这两种回答反映了检验员对样本的两种不同的加工方法。其所用的统计量分别为1, 121
7、XXniXi, 4 , 3, 0 显然,第二种回答是不能令人满意的,因为统计量不包含样本中有关p的全部信息。而第一种回答是综合了样本中有关p的全部信息。因为样本 提供了两种信息: (1) 10次检验中不合格品出现了几次; (2) 不合格品出现在哪几次试验上。1011;IiXT212XXT),(1021XXX 第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的 . 充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。或者说充分统计量包含了有关总体或有关参数的全部信息. 考虑样本 的分布 ),(1021XXX111122101010101111010(,)()(1)
8、(1)(1)iiiixxiiiixxTTP Xx XxXxP Xxpppppp 由于 且 是服从二项分布故11112210101110101111010(,)()(1)(1)(1)iiiixxiiiixxttP Xx XxXxTtP Xxpppppp1T111101110()(1)tttP TtC pp 它与 无关p111111111112210101110101010101010(,|)(1)/(1)(1)/(1)1iixxtttttttttP Xx XxXxTtppC ppppC ppC定义1.3 设总体X的分布为一个含未知参数的分布族 , 是X的一个样本。 是一个统计量,对给定的t ,样
9、本 在的条件 下的条件分布与参数 无关,则称统计量T是参数 的充分统计量。:F),(21nXXX),(21nXXXTT),(21nXXXtT 上例的一般情况是 设 是来自0-1分布 的一个简单随机样本,其中 ,则 是 参数的充分统计量。 12(,)nXXXxxxXP1)1 ()(1 , 0 x01niiXT1 由定义可得定理1.1 设 是参数 的充分统计量, 是单值可逆函数,则 也是参数 的充分统计量。),(21nXXXTT)(ts)(Ts 当总体为连续型总体时,充分统计量要用条件分布密度来描述。奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 基本概念 抽样 分布
限制150内