田间试验与统计方法第四章理论分布和抽样分布.pptx
《田间试验与统计方法第四章理论分布和抽样分布.pptx》由会员分享,可在线阅读,更多相关《田间试验与统计方法第四章理论分布和抽样分布.pptx(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 理论分布与抽样分布理论分布与抽样分布第一节第一节 事件与概率事件与概率第二节第二节 概率分布概率分布第三节第三节 二项式分布二项式分布第四节第四节 正态分布正态分布第五节第五节 抽样分布抽样分布 一、事一、事 件件(一)必然现象与随机现象(一)必然现象与随机现象 必然现象必然现象(inevitable phenomena)或或确定性现象确定性现象(definite phenomena):): 结果可预言,确定的,必然的,可重复结果可预言,确定的,必然的,可重复 例,标准大气压下,水加热到例,标准大气压下,水加热到100C必然沸腾必然沸腾 随机现象随机现象(random pheno
2、mena )或或不确定性现象不确定性现象(indefinite phenomena):): 结果事前不可预言,呈偶然性、不确定性结果事前不可预言,呈偶然性、不确定性 例,种子发芽,抛硬币例,种子发芽,抛硬币随机现象或不确定性现象,有如下随机现象或不确定性现象,有如下特点特点:(1)在一定的条件实现时,有多种可能的结果发生,事前人们不在一定的条件实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性;其结果呈现偶然性、不确定性;(2) 但在相同条件下进行大量重复试验时,其试验结
3、果却呈现出但在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的特定的规律性某种固有的特定的规律性频率的稳定性频率的稳定性,通常称之为随机,通常称之为随机现象的统计规律性。现象的统计规律性。(二)随机试验与随机事件(二)随机试验与随机事件 1、随机试验、随机试验 通常我们把根据某一研究目的通常我们把根据某一研究目的 , 在一定条件下对自然现象在一定条件下对自然现象所进行的观察或试验统称为所进行的观察或试验统称为试验试验(trial)。)。 而一个试验如果满足下述三个特性而一个试验如果满足下述三个特性 , 则则 称称 其其 为为 一个一个 随机试随机试验验(random trial),)
4、,简称简称试验试验: (1)试验可以在相同条件下多次)试验可以在相同条件下多次重复重复进行;进行; (2)每次试验的可能结果不止一个)每次试验的可能结果不止一个 ,并且事先知道会有哪,并且事先知道会有哪些可能的结果;些可能的结果; (3)每次)每次 试验总是恰好出现这些可能结果中的一个试验总是恰好出现这些可能结果中的一个 ,但在,但在一次试验之前却不能肯定这次试验会出现哪一个结果。一次试验之前却不能肯定这次试验会出现哪一个结果。 例如小麦发芽试验,抛硬币。例如小麦发芽试验,抛硬币。 2、随机事件、随机事件 随机试验的每一种可能结果,在一定条件下可随机试验的每一种可能结果,在一定条件下可 能能
5、发发 生生 ,也,也 可可 能能 不不 发生,称为发生,称为随机事件随机事件(random event),简称,简称 事事 件件(event),),通常用通常用A、B、C等来表示。等来表示。 (1)基本事件)基本事件 我我 们们 把把 不不 能能 再再 分的事件称为分的事件称为基本事件基本事件(elementary event) , 也也 称称 为为 样本点样本点(sample point)。)。 例如,在编号为例如,在编号为1、2、3、20 的数字中随机抽取的数字中随机抽取1个,有个,有20种不同的可能结果:种不同的可能结果: “ 取取 得得 一一 个个 编编 号号 是是 1” 、 “ 取得
6、一个编号是取得一个编号是2”、“取得一个取得一个编号是编号是10”,这,这10个事件都是不可能再分的事件,它们都是基本事件。个事件都是不可能再分的事件,它们都是基本事件。 由若干个基本事件组合而成的事件称为由若干个基本事件组合而成的事件称为 复合事件复合事件 (compound event)。)。 如如 “取得一个编号是取得一个编号是 2的倍数的倍数”是一个复合事件,它由是一个复合事件,它由 “ 取得一个编取得一个编号是号是2 ”、 “ 是是4”、“是是6、“是是8”“是是20” 10个基本事件组合而成。个基本事件组合而成。 (2)必然事件)必然事件 我们把在一定条件下必然会发生的事件称为我们
7、把在一定条件下必然会发生的事件称为必然事件必然事件(certain event),用),用表示。其概率为表示。其概率为1 例如,标准大气压下,水加热到例如,标准大气压下,水加热到100C必然沸腾,就是一个必然事件。必然沸腾,就是一个必然事件。(3)不可能事件)不可能事件 我们把在一定条件下不可能发生的事件称为我们把在一定条件下不可能发生的事件称为不可能事件不可能事件(impossible event),用),用表示。其概率为表示。其概率为0 例,没有生活能力的种子播种后会出苗,就是一个不可能事件。例,没有生活能力的种子播种后会出苗,就是一个不可能事件。必然事件与不可能事件实际上是确定性现象,即
8、它们不是随机必然事件与不可能事件实际上是确定性现象,即它们不是随机事件,事件, 但但 是是 为了方便起见,我们把它们看作为两个特殊的随机为了方便起见,我们把它们看作为两个特殊的随机事件。事件。积事件积事件AB和事件和事件A+BABAB互斥事件互斥事件 对立事件对立事件 ABA+B, “或或A发生,或发生,或B发生发生”。AB, “A和和B同时发生或相继发生同时发生或相继发生”AB=V,事件,事件A和B互斥或互不相容互斥或互不相容A+B=U,AB=V,事件,事件B为事件为事件A的对立事件,并记的对立事件,并记B为为A事件间的关系二二 、 概概 率率 研究随机试验,仅知道可能发生哪些随机事件是不够
9、的,还需了解各种随机事研究随机试验,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生的件发生的可能性可能性大小,以揭示这些事件的内在的统计规律性,从而指导实践。大小,以揭示这些事件的内在的统计规律性,从而指导实践。 这就要求有一个能够这就要求有一个能够刻划事件发生可能性大小的数量指标刻划事件发生可能性大小的数量指标,这指标应该是事件本身所固有的,且不随人的主观意志而改变,这指标应该是事件本身所固有的,且不随人的主观意志而改变,人们人们称之为概率称之为概率(probability)。)。 事件事件A的概率记为的概率记为P(A)。)。 (一)(一)概率的统计定义概率的统计定义思考思考:
10、投掷一枚硬币,出现正面的概投掷一枚硬币,出现正面的概率是多大?(率是多大?(0表示反面,表示反面,1表示正表示正面)反复做它,那么所有出现正面面)反复做它,那么所有出现正面的结果平均值是多少?的结果平均值是多少? 英国数学家皮尔逊做英国数学家皮尔逊做24000次抛硬币试验次抛硬币试验 正面向上正面向上12012 次次 频率频率 =随着试验次数的增多,正面朝上的频率越来越接近随着试验次数的增多,正面朝上的频率越来越接近0.5. 5005. 02400012012 二、概率二、概率 例,例,表表 在相同条件下盲蝽象在某棉田危害程度的调查结果在相同条件下盲蝽象在某棉田危害程度的调查结果调查株数调查株
11、数n较多时的稳定频率才能较好地代表棉株受害的可能性较多时的稳定频率才能较好地代表棉株受害的可能性统计学上用统计学上用n较大时稳定的较大时稳定的p近似代表概率。通过大量实验而近似代表概率。通过大量实验而估计的概率称为估计的概率称为实验概率或统计概率实验概率或统计概率,以,以 表示。表示。此处此处P代表概率,代表概率,P(A)代表事件代表事件A的概率,的概率,P(A)变化的范围为变化的范围为01,即,即0P(A)1。naPn limA )((二)(二) 概率的古典定义概率的古典定义 概率的统计定义是在大量的概率的统计定义是在大量的试验试验中以中以频率的稳定性频率的稳定性为基础上提出来的。为基础上提
12、出来的。 不需要做试验,根据随机事件不需要做试验,根据随机事件本身的特性本身的特性就可以确定事件出就可以确定事件出现的概率,称为古典概率现的概率,称为古典概率。 古典概型必须满足以下条件:古典概型必须满足以下条件: 随机试验的全部可能结果(基本事件数)是随机试验的全部可能结果(基本事件数)是有限有限的;的; 各基本事件间是各基本事件间是互不相容互不相容且发生是且发生是等可能等可能的。的。定义:定义: P(A)m / n m为事件为事件A中所包含的基本事件数中所包含的基本事件数 n为基本事件总数。为基本事件总数。 例,在例,在1、2、3、20这这20个数字中随机抽取个数字中随机抽取1个,个,求下
13、列事件的概率求下列事件的概率(1)A“抽得抽得1个数字小于个数字小于5”(2)B=“抽得抽得1个数字是个数字是2的倍数的倍数” 小概率事件小概率事件-随机事件的概率表示随机事件在试验中出现的可随机事件的概率表示随机事件在试验中出现的可能性大小。随机事件的概率很小如,小于能性大小。随机事件的概率很小如,小于0.05或或0.01或0.001小概率原理小概率原理-统计学上,把小概率事件在一次试验中看成是实统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件,称为小概率事件实际不可能性原理,简际不可能发生的事件,称为小概率事件实际不可能性原理,简称小概率原理。称小概率原理。这里的这里的0.05
14、或或0.01称为小概率标准,农业试验研究中通常使用称为小概率标准,农业试验研究中通常使用这两个小概率标准。这两个小概率标准。小概率事件实际不可能性原理是统计学上进行小概率事件实际不可能性原理是统计学上进行假设检验(显著假设检验(显著性检验)的基本依据性检验)的基本依据。(三)(三) 小概率事件实际不可能性原理小概率事件实际不可能性原理 概率是事件在试验结果中出现可能性大小的定量计量概率是事件在试验结果中出现可能性大小的定量计量。它。它是度量随机事件发生的可能性的统计学指标。是度量随机事件发生的可能性的统计学指标。 是事件固有的属性,有以下明显的性质:是事件固有的属性,有以下明显的性质: 随机事
15、件随机事件A的概率:的概率:0P(A)1 必然事件必然事件W的概率为的概率为1,即,即P(W)=1 不可能事件(不可能事件(V)的概率为的概率为0,即,即P(V)=0 概率接近于概率接近于0(如(如P0.05)的事件称为小概率事件。的事件称为小概率事件。(四)(四) 概率的性质概率的性质第二节第二节 概率分布概率分布 (probability distribution)一、随机变量一、随机变量二、概率分布二、概率分布一、随机变量一、随机变量(random variable) 随机变量随机变量是指随机变数所取的某一个实数值。表示随机现象是指随机变数所取的某一个实数值。表示随机现象结果的变量结果的
16、变量,也就是在随机试验中被测定的量,所取得的值称也就是在随机试验中被测定的量,所取得的值称为观察值。为观察值。 例例1:抛硬币试验,两种结果:抛硬币试验,两种结果: 用数用数“1”表示表示“币值面向上币值面向上”, “0”表示表示“国徽面国徽面向上向上” 把把 0,1作为变量作为变量y的取值的取值 可以简单地把抛硬币试验用取值为可以简单地把抛硬币试验用取值为0,1的变量来表示:的变量来表示: P(y=1)=0.5,P(y=0)=0.5 例例2:用:用“1”表示表示“能发芽种子能发芽种子”,其概率为,其概率为p;用;用“0”表示表示“不能发芽种子不能发芽种子”,其概率为,其概率为q。显然显然 p
17、+q=1,则则 P(y=1)=p,P(y=0)=q=1p。例例3:用变量:用变量y表示水稻产量,若表示水稻产量,若y大于大于500kg的概率为的概率为0.25,大于大于300kg且等于小于且等于小于500kg的概率为的概率为0.65,等于小于,等于小于300kg的概率为的概率为0.1。 则用变量则用变量y的取值范围来表示的试验结果为的取值范围来表示的试验结果为 P(y300)=0.10, P(300y500)=0.65, P(y500)=0.25。随机变量随机变量离散型离散型连续型连续型(与我们前面所讲的连续型数据和离散型数据的意义一样)(与我们前面所讲的连续型数据和离散型数据的意义一样)(一
18、)(一) 离散型随机变量离散型随机变量 -当试验只有几个确定的结果,并可当试验只有几个确定的结果,并可一一列出,变量一一列出,变量y的取值可用实数表示,且的取值可用实数表示,且y取某一值时,其概取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。率是确定的,这种类型的变量称为离散型随机变量。 将这种变量的所有可能取值及其对应概率一一列出所形成将这种变量的所有可能取值及其对应概率一一列出所形成的分布称为离散型随机变量的概率分布:的分布称为离散型随机变量的概率分布: 概率概率)(iyyP也可用函数也可用函数f(y)表述,称为表述,称为概率函数概率函数。)(iyyP 前面例前面例1、例、例
19、2中的中的y就是离散型随机变量,将其可能取值与对应概就是离散型随机变量,将其可能取值与对应概率一一列出,即为:率一一列出,即为:)(iyyP)(iyyP图图 离散型随机变量概率分布图离散型随机变量概率分布图 离散型变量离散型变量概率的分布函数概率的分布函数:离散型变量概率的向上:离散型变量概率的向上累积。其公式为累积。其公式为 ,即随机,即随机变量小于等于某一可能值(变量小于等于某一可能值(x0)的概率。)的概率。 0)()()(00 xxiixXPxpxF离散型概率分布的例子离散型概率分布的例子例:例:从从100件产品(其中合格品件产品(其中合格品95件,废品件,废品5件)中任取件)中任取1
20、0件,件, 求每次抽到废品数的概率分布。求每次抽到废品数的概率分布。 概概率率分分布布图图0 00 0. .1 10 0. .2 20 0. .3 30 0. .4 40 0. .5 50 0. .6 60 0. .7 70 01 12 23 34 45 5分分布布函函数数图图0 00 0. .2 20 0. .4 40 0. .6 60 0. .8 81 10 01 12 23 34 45 5(二)(二)连续型随机变量连续型随机变量(continuous random variate) - 对于随机变量,若存在非负可积函数对于随机变量,若存在非负可积函数f(y)(y),对任意,对任意a和和b
21、 (ab)都有都有P(ayb)= , 则则 称称y为为连续型随机变量连续型随机变量(continuous random variate), f(y)称为称为y的的概率密度函数概率密度函数(probability density function)或或分布密度分布密度(distribution density)。 badyyf)( 上述例上述例3中的中的y就是一个连续型随机变量。就是一个连续型随机变量。 概率密度的图形概率密度的图形f (x),称为分布曲线。称为分布曲线。 Xab dxxfbXaPba )( 00 xodx)x(f)xX(P)x(F概率密度函数图和概率分布函数图概率密度函数图和概
22、率分布函数图概率密度函数图概率密度函数图 概率分布函数图概率分布函数图 或或 或或概率分布曲线概率分布曲线 累积分布函数图累积分布函数图yp(x) yF(x) x1x2x2x1P(x1xx2)=F(x2)F(x1)连续型随机变量概率分布的性质:连续型随机变量概率分布的性质:分布密度函数总是大于或等于分布密度函数总是大于或等于0,即,即f (x)0;当随机变量当随机变量x取某一特定值时,其概率等于取某一特定值时,其概率等于0;即即 (c为任意实数为任意实数) 因而,对于连续型随机变量,仅研究其在某一个区间因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率内取值
23、的概率,而不去讨论取某一个值的概率。ccdxxfcxP0)()(第三节第三节 二项式分布二项式分布一、二项总体及二项式分布一、二项总体及二项式分布二、二项式分布的概率计算方法二、二项式分布的概率计算方法三、二项式分布的形状和参数三、二项式分布的形状和参数四、多项式分布四、多项式分布一、二项总体及二项式分布一、二项总体及二项式分布二项总体二项总体(binary population),就是非此即彼的两项构成的总,就是非此即彼的两项构成的总体体 例:例:小麦种子发芽和不发芽,小麦种子发芽和不发芽, 大豆子叶色为黄色和青色,大豆子叶色为黄色和青色, 调查棉田危害分为受害株和不受害株等等。调查棉田危害
24、分为受害株和不受害株等等。通常将二项总体中的通常将二项总体中的“此此”事件以变量事件以变量“1”表示,具概率表示,具概率p;将将“彼彼”事件以变量事件以变量“0”表示,具概率表示,具概率q。因而二项总体又称为因而二项总体又称为0、1总体总体,其概率则显然有:,其概率则显然有:p+q=1如果从二项总体进行如果从二项总体进行n次重复抽样,设出现次重复抽样,设出现“此此”的次数的次数为为y,那么,那么y的取值可能为的取值可能为0、1、2、n,共有,共有n+1种可种可能取值,这能取值,这n+1种取值各有其概率,因而由变量种取值各有其概率,因而由变量y及其概率及其概率就构成了一个分布,这个分布叫做就构成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计 方法 第四 理论 分布 抽样
限制150内