《基本概念与抽样分布26965.pptx》由会员分享,可在线阅读,更多相关《基本概念与抽样分布26965.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中南大学数学与统计学院中南大学数学与统计学院第第1 1章章 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布应用统计应用统计数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布 例例:某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作 第一,对生产出来的钢筋的强度进行检测,获得必要的数据。第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。1.2 总体、个体、样本总体、个体、样本 1.2.1 总体与个体 我们把所研究对象
2、的全体称为总体或母体。组成总体的每个单元称为个体 总体X可看作一个随机变量,称X的概率分布为总体分布,称X的数字特征为总体的数字特征,对总体进行研究就是对总体的分布或对总体的数字特征进行研究.1.2.2 样本 从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量.样本具有二重性:随机性和确定性 定义定义1.1 设总体X的样本满足 独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立;代表性:样本中每一个个体都与总体X有相同分布。则称此样本为简单随机样本。进行有放回抽样就是简单随机样本,无放回抽样就不是简单随机样本。但N很大,n相对较小时无放回抽样得到的样本
3、可以近似看作简单随机样本.称样本的分布为样本分布。如果 为简单随机样本,为总体X的分布函数,则样本分布有比较简单的形式。它完全由总体X的分布函数确定 两种形式例1.1 设有一批产品,其次品率为p,如果记“”表示抽取一件产品是次品;“”表示抽取一件产品是正品;那么,产品的质量可以用X的分布来衡量。X服从0-1分布,参数就是次品率p。如果为简单随机样本,求样本分布.解:总体X的概率分布为 例1.2 设总体X服从参数为 的正态分布,求样本 的分布密度。解:总体X的分布密度为所以 的概率分布为 统计量统计量 统计量的定义 定义1.2 设 为总体X的一个样本,为 的连续函数,且不含有任何未知参数,则称T
4、为一个统计量。注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值;2.统计量是一个随机变量,它将高维随机变量问题转化为一维随机变量来处理,但不会损失所讨论问题的信息量.常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩4.k 阶中心矩 5.顺序统计量6.样本极差 与中位数 例1.3 设总体X为连续型的,求最大顺序统计量与最小顺序统计量的分布密度.解:最大顺序统计量 的分布函数为 最小顺序统计量 的分布函数为 如果总体中服从均匀分布则 其分布密度为充分统计量例:某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为
5、 )外,其它都是合格品(记为 )。当厂长问及检查结果时检验员可作如下两种回答:(1)10件中有两件不合格;(2)前两件不合格。这两种回答反映了检验员对样本的两种不同的加工方法。其所用的统计量分别为 显然,第二种回答是不能令人满意的,因为统计量不包含样本中有关p的全部信息。而第一种回答是综合了样本中有关p的全部信息。因为样本 提供了两种信息:(1)10次检验中不合格品出现了几次;(2)不合格品出现在哪几次试验上。第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的.充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。或者说充分统计量包含了有关总体或有关参数的全部信息
6、.考虑样本 的分布 由于 且 是服从二项分布故 它与 无关定义1.3 设总体X的分布为一个含未知参数的分布族 ,是X的一个样本。是一个统计量,对给定的t,样本 在的条件 下的条件分布与参数 无关,则称统计量T是参数 的充分统计量。上例的一般情况是 设 是来自0-1分布 的一个简单随机样本,其中 ,则 是 参数的充分统计量。由定义可得定理1.1 设 是参数 的充分统计量,是单值可逆函数,则 也是参数 的充分统计量。当总体为连续型总体时,充分统计量要用条件分布密度来描述。奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别充分统计量的方法:因子分解定理
7、。定理1.2(因子分解定理)设样本的联合分布为一个含未知参数的分布族 ,则 是一个充分统计量当且仅当存在这样的两个函数:(1)与 无关的非负函数 ;(2)与 有关,且仅与统计量T的值有关的非负函数 使得 其中 在离散总体的情况下表示样本的分布列,在连续总体的情况下表示样本的分布密度。例 设 是来自 分布,即它的分布密度为 的一个简单随机样本,其中 则 分别是参数 的充分统计量解:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量。例 设总体X的分布密度为 是X的一个简单随机样本,试证明最小顺序统计量 的充分统计量。证:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量。
8、1.4抽样分布 我们称统计量的分布为抽样分布,不同的统计量其分布不一定相同.常见的分布类型有:正态分布正态分布 伽玛分布伽玛分布 卡方分布卡方分布 t 分布分布 F分布分布伽玛分布伽玛分布定义1.4 如果连续型随机变量X的密度函数为其中 为 函数,则称X为服从参数是 的伽玛分布,记为 伽玛分布的性质伽玛分布的性质(1)由此可得(2)如果 ,并且X和Y相互独立,容易求得 这个性质称为可加性,即伽玛分布具有可加性.卡方分布卡方分布用构造性的方式定义是用构造性的方式定义是 定义定义1.5 设设 为相互独立的随机变为相互独立的随机变量,且均服从量,且均服从 ,则它们的平方和,则它们的平方和 也是一个随
9、机变量,它所服从的分布称为自由度也是一个随机变量,它所服从的分布称为自由度为为n的的 分布,记为分布,记为 它的密度函数为 其密度函数与参数n有关,它的图形也有一定差异卡方分布的性质卡方分布的性质若,则若,则即卡方分布是一种伽玛分布,因此具有伽玛即卡方分布是一种伽玛分布,因此具有伽玛分布的性质分布的性质()()()()如果,并且如果,并且X和和Y相互独立,有相互独立,有 卡方分布也具有可加性卡方分布也具有可加性例是来自参数为的指数分布总体,试证明:总体的密度为当时,我们有密度为说明假定子样是简单随机子样,则且它们之间相互独立,故有t 分布分布构造性的方式定义定义1.6 设,且X与Y相互独立,记
10、 则也是一个随机变量,它所服从的分布称为自由度为n的t分布,记为 它的密度函数为与参数n有关,不同的n其图形也有差异性质若则()当时,t分布是柯西分布,柯西分布不存在数学期望和方差参数为2的t分布也不存在数学期望和方差()时,()可以证明这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布 分布分布构造性的方式定义定义1.设,且X与Y相互独立,记 则也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为 它的密度函数为它与m,n有关,其图形也有一定差异容易得到若,则例设试证明:证明:由t分布的构造性定义知,存在相互独立的变量和,使得于是,仍相互独立,由分布的定义知结
11、论成立 分位数:定义1.6 设X为连续型随机变量,其密度函数为,对,如果存在数 满足 则称为此分布的分位数分位数的几何意义 可用图形表示,它的值可查表得到,不同的分布有不同的分位数,有不同的表可查常见的分位数有它们的值可以通过附表1、附表2、附表3、附表4 查得 分位数具有性质(1)(2)(3)当n 足够大时(一般n 45)有近似公式 例:查表求下列分位数的值抽样分布定理 定理1.1 设总体 ,为X的一个简单随机样本,为样本均值与样本方差,则有:(1)(2)(3)相互独立;(4)定理1.2 设有两个总体与,从两个总体与中分别独立抽取容量为m,n的简单样本,记为样本的样本均值与方差,为样本的样本均值与方差,则()例1.8 设总体,分别从X中抽取容量为10与15的两个独立样本,求它们的均值之差的绝对值大于0.3的概率 例1.设总体,是从总体中抽取的简单随机样本,选取常数c,d使得并求出n.中南大学数学与统计学院中南大学数学与统计学院谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH
限制150内