3 理论分布与抽样分布.ppt
《3 理论分布与抽样分布.ppt》由会员分享,可在线阅读,更多相关《3 理论分布与抽样分布.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 理论分布与抽样分布 本章重点介绍有关随机变量的几种常见理论分布、平均数的抽样分布及t 分布。v 前面谈到过间断性资料和连续性资料的简单整理列成次数分布表、图,我们说从中可以看出资料的简单分布规律。那么分布情况的描述我们可以通过随机变量X 的概率函数或概率密度函数来实现。随机变量 下一张 主 页 退 出 上一张 描述随机事件的变量称为随机变量。随机变描述随机事件的变量称为随机变量。随机变量的取值在一次试验前不能确定,具有随机性。量的取值在一次试验前不能确定,具有随机性。作一次试验,其结果有多种可能。每一种可能结作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为果
2、都可用一个数来表示,把这些数作为变量变量xx的取的取值值,则试验结果可用变量,则试验结果可用变量xx来表示。来表示。【例例】对对1010种品牌袋装奶粉进行质量检测,其种品牌袋装奶粉进行质量检测,其可能结果是可能结果是“00种合格种合格”、“11种合格种合格”、“22种合种合格格”、“”、“1010种袋装奶粉都合格种袋装奶粉都合格”。若用。若用xx表示袋装奶粉合格品牌数,则表示袋装奶粉合格品牌数,则xx的取值为的取值为00、11、22、1010。【例】食品加工中高温杀菌可能结果只有两种,即“全部杀死细菌”与“未能全部杀死细菌”。若用变量x 表示试验的两种结果,则可令x=0 表示“未能全部杀死细菌
3、”,x=1 表示“全部杀死细菌”。【例】测定关中地区不同小麦品种的蛋白质含量,其蛋白质含量在9.3-13.5 之间,如用x 表示测定结果,那么x 值可以是这个范围内的任何实数。下一张 主 页 退 出 上一张 离 散 型 随 机 变 量:如果表示试验结果的如果表示试验结果的变量变量xx,其可能取值为可列个,其可能取值为可列个,且,且 以各种确定的以各种确定的概率取这些不同的值概率取这些不同的值,则则 称称 x x 为为 离离 散散 型型 随随 机机 变变 量量(discrete random variable)(discrete random variable);连续 型 随 机 变 量:如果表
4、示试验结果的变如果表示试验结果的变量量x x,其可能取值为某范围内的任何数值,其可能取值为某范围内的任何数值,且,且xx在其取值范围内的任一区间中取值时,其概率是在其取值范围内的任一区间中取值时,其概率是确定的,则称确定的,则称xx为为 连续连续 型型 随随 机机 变变 量量(continuous random variable)continuous random variable)。下一张 主 页 退 出 上一张 试验结果和取此结果的概率可以一一列出。试验结果和取此结果的概率可以一一列出。不能列出试验结果和取此结果的概率,不能列出试验结果和取此结果的概率,只能给出一定范围和在此范围内取值 只
5、能给出一定范围和在此范围内取值的概率。的概率。v 根据资料的分类可知,随机变量X 也可分为:离散型随机变量(间断性随机变量)连续性随机变量二项分布泊松分布正态分布 1.理论分布1.1 二项分布 二项分布是最重要的离散性分布之一,在理论和实践应用上都有重要的地位。它比较简单,但用途很广。v 什么是二项分布呢?:若随机变量X 所有可能取值为0 和正整数:0、1、2、n,且有(k=0,1,2,n),式中p 0,q 0,p+q=1 则称随机变量X 服从参数为n 和p 的二项分布。记作 x B(n,p)。1.1.1 定义v 二项分布的总体特征数:一般只有两种属性类别资料服从二项分布。意思是说,二项分布中
6、,每次试验都有两种且只有两种不同的结果。这两种结果是互不相容的,一种结果发生了,另一种结果就不会发生。1.1.2 二项分布总体特征数v 二项分布的概率分布条形图的形状决定于p 和n。特点是:(1)当p=q=1/2 时,图形是对称的;1.1.3 二项分布特点(2)若pq,图形为偏斜的;当n 很大时,即使pq 图形亦趋于对称。(3)对于固定的n 及p,当k 增加时,Pn(k)先随之增加并达到其极大值,以后又下降。(4)在n 较大,np、nq 较接近时,二项分布接近于正态分布;当n 时,二项分布的极限分布是正态分布。v 例:有一批食品,其合格率为0.85,今在该批食品中随机抽取6 份该食品,求正好有
7、5 份该食品合格的概率,最多有4 份食品合格的概率?v 由题意可知,食品抽检结果有两种可能,合格与不合格,合格率为0.85,即P(A)=0.85,相应不合格率为P()1-0.85 0.15,由概率公式得,正好有5 个合格产品的概率为:1.1.4 二项分布的概率计算及应用条件最多有4 个合格的概率是:v 二项分布的应用条件:v(1)各观察单位 只具有相互对立 的一种结果,如合格或不合格,生存或死亡等等,非此即彼;v(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值;v(3)n 次观察结果互相独立,即每个观察单位的观察结果不
8、会影响到其它观察单位的观察结果。波松分布是一种 可以用来描述和分析随机地发生在单位空间或 时间里的稀有事件的概率分布。要观察到这类事件,样本含量 n 必须很大。所谓稀有事件即是小概率事件。在生物、医学等研究中,服从波松分布的随机变量也是常见的。例如,正常生产线中单位事件生产出不合格产品个数,单位事件内机器出现故障的次数,每升饮水中大肠杆菌数,计数器小方格中血球数,一批香肠中含有毛发的香肠数,1000 袋面粉中含有金属物的袋数等等,都是服从或近似服从波松分布的。1.2 泊松分布1.2.1 泊松分布的定义v 当随机变量x(x=k)所有可能取值是非负整数,且其概率分布为:其中,是一个大于0 的常数;
9、k=1,2,,n,;e 是自然对数的底数;则称随机变量x为服从参数为的泊松分布。记为:x P()。v 泊松分布的特点:泊松分布所依赖的参数是,越小分布越偏,随着的增加,分布趋于对称(见下图)。当=20 时,泊松分布接近于正态分布;当=50 时可以认为泊松分布呈正态分布。所以在实际工作中当20 时就可以用正态分布来近似处理泊松分布的问题。1.2.2 泊松分布的重要特征利用这一特征,可以初步判断一个离散型随机变量是否服从泊松分布。图 不同 的泊松分布 例,某食品店每小时光顾的顾客人数服从=3 的泊松分布,即x P(3)。计算每小时恰有5 人光顾的概率;计算不超过5 人的概率;计算最少有6 人的概率
10、。1.2.3 泊松分布的概率计算 由波松分布的概率计算公式可以看出,依赖于参数 的确定,只要参数 确定了,把k=0,1,2,代入即可求得各项的概率。但是在大多数服从波松分布的实例中,分布参数 往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为 的 估计值,将其代替计算公式中的,计算出 k=0,1,2,时的各项概率。下一张 主 页 退 出 上一张 v 例,为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400 个记录如下:v 试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌数的概率及理论次数。下一张 主 页 退 出 上一张 v 经计算得
11、每毫升水中平均细菌数=0.500,方差S2=0.496。两者很接近,故可认为每毫升水中细菌数服从波松分布。以=0.500 代替,得 v(k=0,1,2)计算结果如表所示。下一张 主 页 退 出 上一张 v 细菌数的泊松分布下一张 主 页 退 出 上一张 v 注意,二项分布的应用条件也是波松分布的应用条件。比如二项分布要求n 次试验是相互独立的,这也是波松分布的要求。v 然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合波松分布的应用条件。v 对于在单位时间、单位面积或单位容积内,所观察的稀有事件由于某些原因分布不随机时,如细菌在牛奶中成集落存
12、在时,不呈波松分布,不能用波松分布来描述其发生规律。下一张 主 页 退 出 上一张 1.3 正态分布(normal distribution)正态分布是一种常见的连续型随机变量的分布。食品科学研究中所涉及的许多变量都是服从或接近正态分布的,如食品中各种营养成分的含量,有害物质的残留量,瓶装食品的重量等。其中 为平均数,为方差,则称随机变量x 服从正态分布,记为x N(,)。相应的概率分布函数为 1.3.1 正态分布的定义 若连续型随机变量x 的概率分布密度函数为 分布密度曲线如所示。其分布规律:中间高两边低,对称且连续,分布曲线是一条光滑的钟形曲线。1.3.2 正态分布的特征(1)以x=为中心
13、左右对称,即f(-x)=f(+x)(2)在 处纵轴最高,即在x=处有最大的概率分布密度。(3)曲线有两个拐点(-,f(-),(+,f(+)。当X 在(-,-)中取值时,曲线向上弯;在(-,+)中取值时曲线向下弯;在(+,+)间取值时,曲线又向上弯。(4)曲线的位置由 确定;曲线的胖瘦由 确定。v(5)曲线在x 轴上方,当x 趋向于,x 轴为渐近线。分布曲线从-到+与横轴所围面积为1。若求X 在实数区间(a,b)上的概率P(a xb)呢?(6)正态分布的次数多数集中在平均数 的附近,离均数越远,其相应次数越少,在3 以外的极少,这就是食品工业控制中的3 原理的基础。1.3.3 标准正态分布 我们
14、称=0,=1 的正态分布为标准正态分布(standard normal distribution)。随机变量u 服从标准正态分布,记作u N(0,1),标准正态分布的概率密度函数及分布函数分别记作 和,得:v 分布密度曲线为:对于任何一个服从正态分布N(,2)的随机变量x,都可以通过标准化变换,u=(x-)将其变换为服从标准正态分布的随机变量u。u 称为标准正态变量或标准正态离差。x x N N(,(,2 2)x x N N(0,1)(0,1)u=u=(x-x-)已知X N(0,1),求X 在实数区间(a,b)上的概率P(a x b)?标准正态分布的计算:v 这个积分比一般正态分布要简单,在实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 理论分布与抽样分布 理论 分布 抽样
限制150内