统计学概率与抽样分布38813.pptx
第5章 概率与抽样分布Probability and Sampling Distributions想过下面的问题吗?l购买一张彩票中奖的可能性有多大?购买一张彩票中奖的可能性有多大?l购购买买一一只只股股票票明明天天上上涨涨的的可可能能性性有有多多大?大?l你你投投资资一一个个餐餐馆馆盈盈利利的的可可能能性性有有多多大大?l一项工程按期完成的可能性有多大?一项工程按期完成的可能性有多大?l明天降水的可能性有多大?明天降水的可能性有多大?第 5 章 概率与概率分布5.1 随机事件及其概率5.2 概率的性质与运算法则5.3 离散型随机变量及其分布5.4 连续型随机变量及其分布学习目标1.了解随机事件、随机试验、含义、几种概率2.掌握随机变量的定义、分布特征及数学期望3.掌握样本均值与成数的抽样分布5.1 随机事件及其概率随机事件及其概率一一.事件及其运算事件及其运算二二.事件的概率事件的概率三三.概率计算的几个例子概率计算的几个例子事件及其运算事件的概念1.1.事事件件(event)(event):随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为32.2.随随机机事事件件(random(random event)event):每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数3.3.必必然然事事件件(certain(certain event)event):每次试验一定出现的事件,用表示例如:掷一枚骰子出现的点数小于74.4.不不可可能能事事件件(impossible(impossible event)event):每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6例解随机试验:抛掷两颗骰子,观察出现的点数试验的样本点和基本事件(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),.,(6,1),(6,2),.,(6,6随机事件A=“点数之和等于3”=(1,2),(2,1)B=“点数之和大于11”=6,6C=“点数之和不小于2”=D=“点数之和大于12”=事件的关系和运算(事件的包含)A AB B B B A A 若事件A发生必然导致事件B发生,则称事件B包含事件A,或事件A包含于事件B,记作或 A B或 B A事件的关系和运算(事件的并或和)事件A和事件B中至少有一个发生的事件称为事件A与事件B 的并。它是由属于事件A或事件B的所有的样本点组成的集合,记为AB或A+BBA A A AB B事件的关系和运算(事件的交或积)A AB B A AB B 事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为BA 或AB事件的关系和运算(互斥事件)A AB B A A 与与与与 B B互不相容互不相容互不相容互不相容 事事件件A A与与事事件件B B中中,若若有有一一个个发发生生,另另一一个个必必定定不不发发生生,则则称称事事件件A A与与事事件件B B是是互互斥斥的的,否否则则称称两两个个事事件件是是相相容容的的。显显然然,事事件件A A与与事事件件B B互互斥斥的的充充分分必必要要条件是事件条件是事件A A与事件与事件B B没有公共的样本点没有公共的样本点事件的关系和运算(事件的逆)A A A 一一个个事事件件B B与与事事件件A A互互斥斥,且且它它与与事事件件A A的的并并是是整整个个样样本本空空间间,则则称称事事件件B B是是事事件件A A的的逆逆事事件件。它它是是由由样样本本空空间间中中所所有有不不属属于于事事件件A A的的样样本本点点所所组组成的集合,记为成的集合,记为 A A事件的关系和运算(事件的差)A A-B BAB B 事件A发生但事件B不发生的事件称为事件A与事件B的差,它是由属于事件A而不属于事件B的那些样本点构成的集合,记为A-B 什么是概率?(probability)1.1.概率是概率是对事件发生的可能性大小的度量对事件发生的可能性大小的度量你你购购买买一一只只股股票票明明天天上上涨涨的的可可能能性性有有多大多大明明天天降降水水的的概概率率是是80%80%。这这里里的的80%80%就就是是对对降降水水这这一一事事件件发发生生的的可可能能性性大大小小的一种数值度量的一种数值度量2.2.一个介于一个介于0 0和和1 1之间的一个值之间的一个值3.3.事件事件A A的概率记为的概率记为P P(A A)事件的实际发生率事件的实际发生率称为称为频率频率。设在相同条。设在相同条件下,独立重复进行件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f/n n。概率概率:随机事件发生的可能性大小随机事件发生的可能性大小,用大,用大写的写的P P 表示;取值表示;取值0 0,1 1。一一、频率与概率、频率与概率frequency and frequency and probabilityprobability概率1.古典概率是指在每次试验中事件等可能出现的条件下,于试验前计算的比率。设事件A是样本空间中的一个随机事件,若样本空间中的基本事件数为n,事件A包含m个基本事件,则事件A的概率为:P(A)=m/n【例】掷一枚的硬币,得到正面的概率为多少?2.2.试验概率试验概率是指在确定的条件下,事件是指在确定的条件下,事件A A在大量的在大量的n n次试验中出现次试验中出现m m次,则事件次,则事件A A的的频率频率 m/n m/n 可作为事件可作为事件A A的概率的概率 p p(A A)的近)的近似比率。这种概率是根据统计试验后的大似比率。这种概率是根据统计试验后的大量数据整理所得,故称试验概率,也称后量数据整理所得,故称试验概率,也称后验概率和统计概率。记为:验概率和统计概率。记为:3.主观概率是指人们凭个人经验对某一事件发生的可能性大小作出的估计。例如,天空看上去阴沉沉的,估计下雨的可能性有多大;股价指数在未来一周内上升的可能性有多大;一种新产品在未来市场上畅销的可能性有多大等。1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 2.样本含量样本含量n越大,波动幅度越小,频率越接近概率。越大,波动幅度越小,频率越接近概率。频率与概率的关系:频率与概率的关系:表表 在相同条件下盲在相同条件下盲蝽蝽象在某棉田危害程度的象在某棉田危害程度的调查结调查结果果一一、频率与概率、频率与概率frequency and frequency and probabilityprobability一一、频率与概率、频率与概率frequency and frequency and probabilityprobability 小概率原理小概率原理 若事件若事件A发生的概率较小,如小于发生的概率较小,如小于0.05或或0.01,则,则认为事件认为事件A在一次试验中不太可能发生,这称为小概在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称率事件实际不可能性原理,简称小概率原理小概率原理。这里。这里的的0.05或或0.01称为小概率标准,农业试验研究中通常称为小概率标准,农业试验研究中通常使用这两个小概率标准。使用这两个小概率标准。二二、随机变量随机变量事先不知道会出现什么结果事先不知道会出现什么结果投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好 一般一般用用 X,Y,Z 来表示来表示根据取值情况的不同分为离散型随机变根据取值情况的不同分为离散型随机变量和连续型随机变量量和连续型随机变量离散型和连续型离散型和连续型随机变量随机变量随机变量的可能取值是离散的数字,如计数型或分类随机变量的可能取值是离散的数字,如计数型或分类型等,称为离散型随机变量型等,称为离散型随机变量(discrete random discrete random variable)variable)。0,1,9 0,1,9。2020次实验中成功的次数,次实验中成功的次数,二项式分布。二项式分布。随机变量的可能取值是某一实数的区间,如随机变量的可能取值是某一实数的区间,如“大于大于0”0”或或“-22“-22之间之间”等,称为连续型随机变量等,称为连续型随机变量(continuous random variable)continuous random variable)。正态随机变量正态随机变量三三、随机变量随机变量三、离散型随机变量三、离散型随机变量(discrete random variables)1.随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1,x2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子离散型数学期望和方差(例题分析)【例例例例】一一一一家家家家电电电电脑脑脑脑配配配配件件件件供供供供应应应应商商商商声声声声称称称称,他他他他所所所所提提提提供供供供的的的的配配配配件件件件100100个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表 每每每每100100100100个配件中的次品数及概率分布个配件中的次品数及概率分布个配件中的次品数及概率分布个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差求该供应商次品数的数学期望和标准差 三、离散型随机变量的概率分布三、离散型随机变量的概率分布列出离散型随机变量列出离散型随机变量X X的所有可能取值的所有可能取值列出随机变量取这些值的概率列出随机变量取这些值的概率通常用下面的表格来表示通常用下面的表格来表示P(X=xP(X=xi i)=p)=pi i称为离散型随机变量的概率函数称为离散型随机变量的概率函数连续型随机变量连续型随机变量(continuous random variables)1.1.可以取一个或多个区间中任何值可以取一个或多个区间中任何值 2.2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出出来来,而而是是取取数数轴轴上上某某一区间内的任意点一区间内的任意点3.3.连续型随机变量的一些例子连续型随机变量的一些例子连续型随机变量的期望和方差1.1.连续型随机变量的期望值连续型随机变量的期望值 2.2.方差方差四、连续型随机变量的概率四、连续型随机变量的概率密度密度若观察资料数量够大,则直方图若观察资料数量够大,则直方图(组数适组数适当增加当增加)的整体的整体形形态可用一近似的平滑态可用一近似的平滑曲线显示。曲线显示。直方图中纵轴改为次数比例,则该平滑直方图中纵轴改为次数比例,则该平滑曲线称为密度曲线曲线称为密度曲线(density curve)density curve)。概率密度曲线密度曲线的性质密度曲线的性质曲线都在水平线上曲线都在水平线上(密度函数密度函数=0)=0)。曲线下所涵盖的全部面积正好为曲线下所涵盖的全部面积正好为1(1(所有可能所有可能性为性为1)1)。曲线下任何范围所涵盖的面积,为观察值曲线下任何范围所涵盖的面积,为观察值落在该范围的比例落在该范围的比例(概率概率)。密度曲线可视为是观察变量的理论分密度曲线可视为是观察变量的理论分布布图图形。形。四、连续型随机变量的概率四、连续型随机变量的概率密度密度随机变量随机变量X X的一切可能取值的完备组中,各的一切可能取值的完备组中,各可能取值可能取值xi xi与其相对应的概率与其相对应的概率pi pi乘积之和乘积之和描述随机变量取值的集中程度描述随机变量取值的集中程度计算公式为计算公式为五、随机变量的数学期望五、随机变量的数学期望随机变量随机变量X X的每一个取值与期望值的离的每一个取值与期望值的离差平方和的数学期望,记为差平方和的数学期望,记为D(X)D(X)描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度计算公式为计算公式为六、随机变量的方差六、随机变量的方差5.2 The Binomial Distributions 二项分布二项分布(了解)(了解)一、一、二项分布设定二项分布设定The Binomial SettingThe Binomial Setting固定的观察次数固定的观察次数 n n。n n 次的观察都独立,每次的观察都不会对其次的观察都独立,每次的观察都不会对其他观察提供任何他观察提供任何信信息。息。每次的观察都只有两种可能的结果,多假每次的观察都只有两种可能的结果,多假设为设为“成功成功”或或“失败失败”两种。两种。每次的观察每次的观察“成功成功”的概率都一样,设定的概率都一样,设定为为 p p。二、二、二项分布二项分布Binomial DistributionBinomial Distribution满足二项分布设定的试验,以满足二项分布设定的试验,以 X X 记录记录 n n次观察次观察中中“成功成功”的次数,则称的次数,则称 X X 的分布为参数为的分布为参数为 n n 与与 p p 的二项分布的二项分布(binomial)binomial),记为记为B(n,p)B(n,p)。X X 的的所有可能取值所有可能取值为为0,1,0,1,nn。对应的概率函数为对应的概率函数为 P(X=x)=P(x)P(X=x)=P(x)。例例1 1 某种昆虫在某地区的死亡率为某种昆虫在某地区的死亡率为40%40%,即,即p p=0.4=0.4,现对这种害虫用一种新药进行治疗试验,现对这种害虫用一种新药进行治疗试验,每次抽样每次抽样1010头作为一组治疗。试问如新药无疗效,头作为一组治疗。试问如新药无疗效,则在则在1010头中死头中死3 3头、头、2 2头、头、1 1头,以及全部愈好的概头,以及全部愈好的概率为多少?率为多少?按上述二项分布概率函数式计算按上述二项分布概率函数式计算 7头愈好,头愈好,3头死去概率:头死去概率:8头愈好,头愈好,2头死去概率:头死去概率:9头愈好,头愈好,1头死去概率:头死去概率:10头全部愈好的概率:头全部愈好的概率:【例】【例】若若问问10头中不超过头中不超过2头死去的概率为多少?头死去的概率为多少?则应该应用累积函数,即则应该应用累积函数,即四、四、二项分布的期望值与标准差二项分布的期望值与标准差期望值:期望值:E(X)=np方差:方差:Var(X)=np(1-p)标准差:标准差:5.3 Normal Distributions 正态分布正态分布(掌握)(掌握)(连续型变量的概率分布)(连续型变量的概率分布)一、特点一、特点正正态曲线态曲线所有所有正正态曲线都有相同的外型态曲线都有相同的外型具有对称、单峰及钟形的特性。具有对称、单峰及钟形的特性。正正态曲线所代表的分态曲线所代表的分布布即为即为正态正态分分布布(normal distribution)normal distribution)每一每一正正态分态分布布都有其平均值都有其平均值 与标准与标准差差 s s一、特点正正态曲线态曲线较大较大 s s一、特点一、特点正态曲线的拐点拐拐点落在点落在一个处拐拐点落在点落在-处处一、特点二二、P117P117规则规则正正态分态分布布有其特定的数据分布规则:有其特定的数据分布规则:平均值为平均值为,标准差为标准差为 的的正正态分态分布布68%68%的观察资料落在的观察资料落在 的的 1 1 之内之内95%95%的观察资料落在的观察资料落在 的的 2 2 之内之内99.7%99.7%的观察资料落在的观察资料落在 的的 3 3 之内之内0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的资料95%的资料99.7%的资料三、P117规则四、变量四、变量标准化标准化(Standardization)Standardization)令观察值令观察值 x x 服从平均值为服从平均值为 ,标准差为,标准差为 的分的分布布,则,则 x x 的标准化的标准化值值(standardized(standardized value)value)定义定义为为标准化标准化值值又称为又称为 z-z-值值(z-score)z-score)。标准化变量标准化变量可以证明可以证明z z的平均值为的平均值为0 0z z的标准差为的标准差为1 1四、变量四、变量标准化标准化(Standardization)Standardization)五、五、标准标准正正态分态分布布变量变量 X X 服从平均值为服从平均值为 ,标准差为,标准差为 的的正正态分态分布布,简记为,简记为 X N(,X N(,2 2)。X X 经过标准化后为经过标准化后为 Z Z(=(X-)/s)(=(X-)/s),则则 Z Z 也服从正态分布,并且也服从正态分布,并且平均值为平均值为 0 0,标,标准差为准差为 1 1,即,即Z N(0,1)Z N(0,1)。我们称我们称 Z Z 服从服从标准标准正正态态(standard normal)standard normal)。六、六、标准标准正正态表态表z表列数字是表列数字是z左边的面积左边的面积z=-0.44z左边的面积为左边的面积为0.33-0.440.33z表列数字是表列数字是z z左边的面积左边的面积z=0.44z z左边的面积为左边的面积为0.67六、标准正态表七、双侧七、双侧临界值临界值在标准在标准正正态曲线图下,态曲线图下,右方右方与与 左方左方的面积的面积和和为为 a a,则称则称 为为标准正态分布概标准正态分布概率为率为 a a 的双侧的双侧临界值。可查表。临界值。可查表。=0面积为面积为a/2a/2面积为面积为a/2a/2八、单侧八、单侧临界值临界值在标准在标准正正态曲线图下,态曲线图下,右方的面积为右方的面积为 a a,则称则称 为为标准正态分布概率为标准正态分布概率为 a a 的单侧的单侧临临界值。可查表界值。可查表。=0面积为a正态分布(用Excel计算概率)第1步:进入Excel表格界面,将鼠标停留在某一空白单元格第2步:在Excel表格界面中,直接点击【f(x)】(粘贴函数)命令 第3步:在复选框“函数分类”中点击【统计】选项,并在“函数名”中点击【NORMDIST】选项,然后【确定】第4步:在【X X】后填入正态分布函数计算的区间点(本例为40)在【Mean】后填入正态分布的均值 (本例为50)在【P Standard_dev】后填入标准差 (本例为10)在【Cumulative】后填入1(或TRUE)表示计算事件出现次数小于或等于指定数值的累积概率值 九、计算九、计算P126,选择题选择题12、13、14题题 t-分布 由正态分布导出的几个重要分布分布由正态分布导出的几个重要分布分布t-分布(t-distribution)1.1.提出者是提出者是提出者是提出者是William GossetWilliam Gosset,也被称为学生分布,也被称为学生分布,也被称为学生分布,也被称为学生分布(students t)(students t)2.2.t t 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参参参参数数数数。随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大,分分分分布布布布也也也也逐渐趋于正态分布逐渐趋于正态分布逐渐趋于正态分布逐渐趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z zt t-分布分布(用Excel生成t分布的临界值表)1.利用Excel中的【TDIST】统计函数,可以计算给定值和自由度时分布的概率值l l语法:语法:TDIST(x,degrees_freedom,tails)TDIST(x,degrees_freedom,tails)2.利用【TINV】函数则可以计算给定概率和自由度时的相应 1.语法:TINV(probability,degrees_freedom)TINV(probability,degrees_freedom)用用ExcelExcel生成生成t t分布的临界值表分布的临界值表1.1.为为纪纪念念统统计计学学家家费费希希尔尔(R.A.FisherR.A.Fisher)以以其其姓姓氏氏的的第第一一个字母来命名则个字母来命名则2.2.设设若若U U为为服服从从自自由由度度为为n n1 1的的 2 2分分布布,即即U U 2 2(n n1 1),V V为为服服从从自自由由度度为为n n2 2的的 2 2分分布布,即即V V 2 2(n n2 2),),且且U U和和V V相互独立,则相互独立,则 称称F F为服从自由度为服从自由度n n1 1和和n n2 2的的F F分布,记为分布,记为F F-分布分布(F distribution)2008年年5月月不同自由度的F分布(图示)F F F(1,10)(1,10)(5,10)(5,10)(10,10)(10,10)F-分布(用Excel计算F分布的概率)1.1.利利用用ExcelExcel提提供供的的【FDISTFDIST】统统计计函函数数,计计算算分分布布右右单单尾的概率值尾的概率值l l语法:语法:FDIST(x,degrees_freedom1,degrees_freedom2)FDIST(x,degrees_freedom1,degrees_freedom2)2.2.利利用用【FINVFINV】函函数数则则可可以以计计算算给给定定单单尾尾概概率率和和自自由由度度时的相应时的相应 l语法:1.FINV(probability,degrees_freedom1,degrees_freedom2)用用ExcelExcel计算计算F F分布的概率分布的概率5.4Sampling Distributions抽样分布抽样分布一、总体与样本 population and sample总体总体:根据研究目的:根据研究目的确定的确定的同质同质研究对象研究对象的的全体全体(集合)。分(集合)。分有限总体与无限总体有限总体与无限总体样本样本:从总体中随机:从总体中随机抽取的部分研究对象抽取的部分研究对象 二、总体容量与样本容量population size and sample size总体容量(总体容量(N):总体:总体中所包含的个体数目。中所包含的个体数目。根据根据N大小,总体分大小,总体分有限总体有限总体和和无限总体无限总体样本样本(n):从总体中随:从总体中随机抽取的部分研究对机抽取的部分研究对象象 三、随机抽样 random sampling为了保证样本的为了保证样本的可靠可靠性性和和代表性代表性,需要采,需要采用随机的方法抽取样用随机的方法抽取样本(在总体中每个个本(在总体中每个个体具有体具有相同的机会相同的机会被被抽到)。抽到)。四、参数与统计量parameter and statistic参数参数:总体总体的统计指标,的统计指标,如总体均数、标准差,采如总体均数、标准差,采用希腊字母分别记为用希腊字母分别记为、。固定的常数固定的常数 总体总体样样本本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用英的统计指标,如样本均数、标准差,采用英文字母分别记为文字母分别记为 。参数附近波动的随机变量参数附近波动的随机变量。五、总体均值、方差与标准差总体均值总体方差总体标准差六、样本均值、方差与标准差总体均值总体方差总体标准差1.容量相同的所有可能样本的样本均值的概率分布2.一种理论概率分布3.进行推断总体总体均值 的理论基础七七、样样本均本均值值的抽的抽样样分布分布样样本均本均值值的抽的抽样样分布分布(例例题题分析分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N=4 4。4 4 个个个个个个个个体体体体分分分分别别别别为为为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总体的均值、方差及分布如下总体的均值、方差及分布如下总体的均值、方差及分布如下总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差.4.4样样本均本均值值的抽的抽样样分布分布(例例题题分析分析)现现现现从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n2 2的的的的简简简简单单单单随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样条件下,共有样条件下,共有样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2 的样本(共16个)样样本均本均值值的抽的抽样样分布分布(例例题题分析分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5八、样本的概率分布统计量统计量(为样本的函数为样本的函数),亦为随机变量,其概率,亦为随机变量,其概率分布分布称为抽样分布称为抽样分布(sampling distribution)sampling distribution)。一般统计量的抽样分布,则多根据重复抽样一般统计量的抽样分布,则多根据重复抽样(实实验验)结果来了解其概率结果来了解其概率分布分布。的的抽样抽样分布分布大数法则,中心极限定理大数法则,中心极限定理样样本均本均值值的分布与的分布与总总体分布的比体分布的比较较(例例题题分析分析)=2.5 2=1.25总体分布总体分布总体分布总体分布抽样分布抽样分布抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X1 14 42 23 30 0.1.1.2.2.3.3.4.4八、大数法则由具有有限由具有有限(finite)finite)平均数平均数 的总体随机抽的总体随机抽样,随着样本容量的增加,样本平均数样,随着样本容量的增加,样本平均数 越接近总体的均数越接近总体的均数 。样本平均数的这种行为称为大数法则样本平均数的这种行为称为大数法则(law of law of large numbers)large numbers)。以以 代表样本容量为代表样本容量为 n n 的资料平均数,逐的资料平均数,逐渐增加样本渐增加样本容量,容量,将将 n n 及对应的及对应的 图示如图示如后。后。八、大数法则Number of observations,n前 n个样本的均数22232425262728293031323315 1050100500 1000500010000八、大数法则九、九、样样本均本均值值的抽的抽样样分布与中心极限定理分布与中心极限定理 =50=50=50 =10=10=10X XX总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N(,2 2)时时时时,来来来来自自自自该该该该总总总总体体体体的的的的所所所所有有有有容容容容量量量量为为为为n n的的的的样样样样本本本本的的的的均均均均值值值值 X X也也也也服服服服从从从从正正正正态态态态分分分分布布布布,X X 的的的的数学期望为数学期望为数学期望为数学期望为,方差为,方差为,方差为,方差为 2 2/n n。即。即。即。即 X XN N(,2 2/n n)中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设设设从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽样分布近似服从均值为抽样分布近似服从均值为抽样分布近似服从均值为抽样分布近似服从均值为、方差为、方差为、方差为、方差为 2 2/n n的正态分布的正态分布的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X 例例5 在江苏沛县调查在江苏沛县调查336个个m2小地老虎虫危害情况的结小地老虎虫危害情况的结果,果,=4.73头,头,=2.63,试问样本容量,试问样本容量n=30时,由于随机抽时,由于随机抽样得到样本平均数样得到样本平均数 等于或小于等于或小于4.37的概率为多少?的概率为多少?中心极限定理(CLT)查附表查附表,P(u0.36)=0.2266,即概率为,即概率为22.66%(属属一尾概率一尾概率)。因所得概率较大,说明差数。因所得概率较大,说明差数0.36是随机误差,是随机误差,从而证明这样本平均数从而证明这样本平均数4.37是有代表性的,变异系数为:是有代表性的,变异系数为:中心极限定理(CLT)十、样本比例的抽样分布1.总体(或样本)中具有某种属性的单位与全部单位总数之比,也叫成数。不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为 比例比例(proportion)1.样本比例的数学期望2.样本比例的方差重复抽样不重复抽样样样本比例的抽本比例的抽样样分布分布(数学期望与方差数学期望与方差)习题教材后选择题3抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布非正态分布非正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布非正态分布非正态分布非正态分布非正态分布本章小结1.度量时间发生的可能性度量时间发生的可能性概率概率2.离散型概率分布离散型概率分布 二项分布,泊松分布,超几何分布二项分布,泊松分布,超几何分布3.连续型概率分布连续型概率分布 正态分布正态分布4.由正态分布导出的几个重要分布由正态分布导出的几个重要分布 c c c c2 2-分布,分布,t t-分布,分布,F F-分布分布5.样本统计量的抽样分布样本统计量的抽样分布谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH