《概率与抽样分布》PPT课件.ppt
第第 4 4 章章 概率与抽样分布概率与抽样分布4.1 4.1 概率与概率分布基本概念概率与概率分布基本概念4.2 4.2 离散型随机变量的概率分布离散型随机变量的概率分布4.3 4.3 连续型随机变量的概率分布连续型随机变量的概率分布4.4 4.4 抽样分布抽样分布 4.4.1 4.4.1 一个总体参数推断时样本统计量分布一个总体参数推断时样本统计量分布 4.4.2 4.4.2 两个总体参数推断时样本统计量分布两个总体参数推断时样本统计量分布学习目标学习目标1.定义试验、事件、样本空间、概率定义试验、事件、样本空间、概率2.定义和解释随机变量及其分布定义和解释随机变量及其分布3.计算离散型随机变量的概率和概率分布计算离散型随机变量的概率和概率分布4.计算连续型随机变量的概率计算连续型随机变量的概率5.掌握抽样分布掌握抽样分布6.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布7.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布4.1 4.1 概率与概率分布基本概念概率与概率分布基本概念4.1.1 概率概率4.1.2 随机变量随机变量4.1.3 分布分布4.1.1 概率概率试验、事件和样本空间试 验(experiment)1.概念:对试验对象进行一次观察或测量的过程概念:对试验对象进行一次观察或测量的过程 掷一颗骰子,观察其出现的点数掷一颗骰子,观察其出现的点数从一副从一副5252张扑克牌中抽取一张,并观察其结果张扑克牌中抽取一张,并观察其结果(纸纸牌的数字或花色牌的数字或花色)2.试验的特点试验的特点可以在相同的条件下重复进行可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果在试验结束之前,不能确定该次试验的确切结果事件(event)1.1.事件:事件:观察或实验的结果叫事件掷一颗骰子出现的点数为3用大写字母A,B,C,表示2.2.随随机机事事件件(random(random event)event):每次试验可能出现也可能不出现的事件掷一颗骰子可能出现的点数3.必必然然事事件件(certain event):每每次次试试验验一一定定出出现现的的事件,用事件,用 表示表示掷一颗骰子出现的点数小于掷一颗骰子出现的点数小于74.不不可可能能事事件件(impossible event):每每次次试试验验一一定定不不出现的事件,用出现的事件,用 表示表示掷一颗骰子出现的点数大于掷一颗骰子出现的点数大于6样本空间样本空间简单事件简单事件简单事件简单事件(simple event)(simple event)(simple event)(simple event):不能被分解成两:不能被分解成两个或更多个事件的事件,也称为基本事件。个或更多个事件的事件,也称为基本事件。抛一枚均匀硬币,抛一枚均匀硬币,“出现正面出现正面”和和“出现出现反面反面”在一次试验中只能观察到一个且仅有一个在一次试验中只能观察到一个且仅有一个简单事件。简单事件。样本空间样本空间样本空间样本空间(sample Space)(sample Space)一次试验中所有简单事件的全体用表示例如:在掷一颗骰子的试验中,样本空间表示为:1,2,3,4,5,6在投掷硬币的试验中,正面,反面(随机)事件的概率(随机)事件的概率事件的概率事件的概率(probability)(probability)事事件件A A的的概概率率是是一一个个介介于于0 0和和1 1之之间间的的一一个个值值,用用以以度度量量试试验验完完成成时时事事件件A A发发生生的的可可能性大小,能性大小,记为记为P P(A A).).概率的古典定义 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为概率的古典定义(例题分析)【例】【例】某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,(1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率某钢铁公司所属企业职工人数某钢铁公司所属企业职工人数工厂工厂男职工男职工女职工女职工合计合计炼钢厂炼钢厂炼铁厂炼铁厂轧钢厂轧钢厂4400320090018001600600620048001500合计合计8500400012500概率的古典定义(例题分析)解解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则 (2)(2)用用B B 表表示示“抽抽中中的的职职工工为为炼炼钢钢厂厂职职工工”;B B为为炼炼钢钢厂厂 全体职工的集合;基本空间为全体职工的集合。则全体职工的集合;基本空间为全体职工的集合。则概率的统计定义 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为概率的统计定义(例题分析)【例】:【例】:某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。解解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有主观概率定义1.对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定2.概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断4.1.2 随机变量随机变量随机变量随机变量(random variables)(random variables)1.1.一次试验的结果的数值性描述一次试验的结果的数值性描述2.2.一般一般用用 X X,Y Y,Z Z 来表示来表示3.3.例如:例如:投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量4.4.根据取值情况的不同分为离散型随机变根据取值情况的不同分为离散型随机变量和连续型随机变量量和连续型随机变量离散型随机变量离散型随机变量(discrete random variables)1.1.随随机机变变量量 X X 取取有有限限个个值值或或所所有有取取值值都都可可以以逐个列举逐个列举出来出来 x x1 1,x x2 2,2.2.以确定的概率取这些不同的值以确定的概率取这些不同的值3.3.离散离散型随机变量的一些例子型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾顾客数客数销销售量售量顾顾客性客性别别0,1,2,1000,1,2,0,1,2,男性男性为为0,女性女性为为1连续型随机变量连续型随机变量(continuous random variables)(continuous random variables)1.1.可以取一个或多个区间中任何值可以取一个或多个区间中任何值 2.2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出出来来,而而是是取取数数轴上某一区间内的任意点轴上某一区间内的任意点3.3.连续型随机变量的一些例子连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查一批一批电电子元件子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长长度度使用寿命使用寿命(小小时时)半年后工程完成的百分比半年后工程完成的百分比测测量量误误差差(cm)X 00 X 100X 04.1.3 4.1.3 分布分布分布分布(概率分布概率分布):随机变量取一切可能值:随机变量取一切可能值或范围的概率或概率规律称为概率分布。或范围的概率或概率规律称为概率分布。4.2 离散型随机变量概率分布离散型随机变量概率分布4.2.1 离散型随机变量的概率分布离散型随机变量的概率分布4.2.2 离散型随机变量的数学期望和方差离散型随机变量的数学期望和方差4.2.3 几种常用的离散型概率分布几种常用的离散型概率分布离散型随机变量的概率分布离散型随机变量的概率分布1.1.列出离散型随机变量列出离散型随机变量X X的所有可能取值的所有可能取值2.2.列出随机变量取这些值的概率列出随机变量取这些值的概率3.3.通常用下面的表格来表示通常用下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pn 称该表格形式为离散型随机变量称该表格形式为离散型随机变量称该表格形式为离散型随机变量称该表格形式为离散型随机变量X X X X的概率分的概率分的概率分的概率分布,其中:布,其中:布,其中:布,其中:P P P P(X X X X=x x x xi i i i)=)=)=)=p p p pi i i i称为离散型随机变量称为离散型随机变量称为离散型随机变量称为离散型随机变量的概率函数的概率函数的概率函数的概率函数 p p p pi i i i 0 0 0 0;离散型随机变量的概率分布(例题分析)【例例】投掷一颗骰子后出现的点数是一个离散型随机变量。写出掷一枚骰子出现点数的概率分布 X=xi123456P(X=xi)pi1/61/61/61/61/61/6概率分布概率分布离散型随机变量的概率分布(例题分析)【例例】一部电梯在一周内发生故障的次数X及相应的概率如下表故障次数X=xi0123概率P(X=xi)pi0.100.250.35 一部电梯一周发生故障的次数及概率分布一部电梯一周发生故障的次数及概率分布 (1)(1)确定确定 的值的值 (2)(2)求正好发生两次故障的概率求正好发生两次故障的概率 (3)(3)求最多发生两次故障的概率求最多发生两次故障的概率离散型随机变量的概率分布(例题分析)解:解:(1)由于0.10+0.25+0.35+=1 所以,(2)P(X (3)P(X 离散型随机变量的数学期望和方差离散型随机变量的数学期望和方差离散型随机变量的数学期望(expected value)1.1.离离散散型型随随机机变变量量X X的的所所有有可可能能取取值值x xi i与与其其取取值值相相对应的对应的概率概率p pi i乘积之和乘积之和2.2.描述离散型随机变量取值的集中程度描述离散型随机变量取值的集中程度3.3.记为记为 或或E E(X X)4.4.计算公式为计算公式为离散型随机变量的方差离散型随机变量的方差(variance)(variance)1.随机变量X的每一个取值与期望值的离差平方和的数学期望,记为 2 或D(X)2.描述离散型随机变量取值的分散程度3.计算公式为4.方差的平方根称为标准差,记为 或离散型数学期望和方差(例题分析)【例例例例】一一家家电电脑脑配配件件供供应应商商声声称称,他他所所提提供供的的配配件件100100个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表 次品数X=xi0123概率P(X=xi)pi0.750.120.080.05每每100100个配件中的次品数及概率分布个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差求该供应商次品数的数学期望和标准差 几种常用的离散型概率分布常用离散型概率分布常用离散型概率分布二项分布二项分布泊松分布泊松分布二项试验二项试验(伯努利试验伯努利试验)1.1.二项分布与伯努利试验有关二项分布与伯努利试验有关2.2.贝努利试验满足下列条件贝努利试验满足下列条件一一次次试试验验只只有有两两个个可可能能结结果果,即即“成成功功”和和“失败失败”“成功成功”是指我们感兴趣的某种特征是指我们感兴趣的某种特征一一次次试试验验“成成功功”的的概概率率为为p p,失失败败的的概概率率为为q q=1-=1-p p,且概率且概率p p对每次试验都是相同的对每次试验都是相同的 试验是相互独立的,并可以重复进行试验是相互独立的,并可以重复进行n n次次 在在n n次次试试验验中中,“成成功功”的的次次数数对对应应一一个个离离散散型型随机变量随机变量X X 二项分布二项分布(Binomial distribution)(Binomial distribution)1.重复进行 n 次试验,出现“成功”的次数的概率分布称为二项分布,记为XB(n,p)2.设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为二项分布二项分布(数学期望和方差数学期望和方差)1.数数学期望学期望2.=E(X)=np2.方差方差3.2=D(X)=npq二项分布二项分布(例题分析例题分析)【例】【例】【例】【例】已知一批产品的次品率为已知一批产品的次品率为4%4%,从中任意有放回地抽,从中任意有放回地抽 取取5 5个。求个。求5 5个产品中:个产品中:(1)(1)没有次品的概率是多少?没有次品的概率是多少?(2)(2)恰好有恰好有1 1个次品的概率是多少?个次品的概率是多少?(3)(3)有有3 3个以下次品的概率是多少?个以下次品的概率是多少?二项分布二项分布(例题分析例题分析)【例】【例】【例】【例】已知一批产品的次品率为已知一批产品的次品率为4%4%,从中任意有放回地抽,从中任意有放回地抽 取取5 5个。求个。求5 5个产品中:个产品中:出现次品的期望值、方差出现次品的期望值、方差数学期望数学期望 =E(X)=np方差方差 2=D(X)=npq泊松分布(Poisson distribution)1.1837年法国数学家泊松年法国数学家泊松,17811840)首次提出首次提出 2.用用于于描描述述在在一一指指定定时时间间范范围围内内或或在在一一定定的的长长度度、面积、体积之内每一事件出现次数的分布面积、体积之内每一事件出现次数的分布3.泊松分布的例子泊松分布的例子一定时间段内,某航空公司接到的订票电话数一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一定时间内,到车站等候公共汽车的人数一定路段内,路面出现大损坏的次数一定路段内,路面出现大损坏的次数一定时间段内,放射性物质放射的粒子数一定时间段内,放射性物质放射的粒子数一匹布上发现的疵点个数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数一定页数的书刊上出现的错别字个数 泊松分布(概率分布函数)给定的时间间隔、长度、面 积、体积内“成功”的平均数e=2.71828 x 给定的时间间隔、长度、面 积、体积内“成功”的次数泊松分布泊松分布(数学期望和方差数学期望和方差)1.1.数学期望数学期望2.2.E E(X X)=)=2.2.方方差差3.3.D D(X X)=)=泊松分布(例题分析)【例例例例】假假定定某某航航空空公公司司预预订订票票处处平平均均每每小小时时接接到到4242次次订订票票电电话话,那那么么1010分分钟钟内内恰恰好好接接到到6 6次次电电话话的的概概率是多少?率是多少?解:解:解:解:设设X X=1010分钟内航空公司预订票处接到的电话次数分钟内航空公司预订票处接到的电话次数 4.3 连续型概率分布连续型概率分布4.3.1 概率密度函数概率密度函数4.3.2 正态分布正态分布概率密度函数连续型随机变量的概率分布连续型随机变量的概率分布1.1.连连续续型型随随机机变变量量可可以以取取某某一一区区间间或或整整个个实实数数轴轴上上的任意一个值的任意一个值2.2.它取任何一个特定的值的概率都等于它取任何一个特定的值的概率都等于0 03.3.不能列出每一个值及其相应的概率不能列出每一个值及其相应的概率4.4.通常研究它取某一区间值的概率通常研究它取某一区间值的概率5.5.用分布函数的形式和概率密度函数的形式来描述用分布函数的形式和概率密度函数的形式来描述由随机变量的定义可知由随机变量的定义可知Xx是一随机事件是一随机事件,可以对它求概率可以对它求概率,记记F(x)=P(Xx),该函数就是随机变量的分布函数,分布函数该函数就是随机变量的分布函数,分布函数的导数称为密度函数,记作的导数称为密度函数,记作f(x);概率密度函数(probability density function)1.设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件 注意:注意:f(x)不是概率不是概率概率密度函数 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积f(x)xab概率是曲线下的面积概率是曲线下的面积分布函数与密度函数的图示分布函数与密度函数的图示1.密度函数曲线下的面积等于12.分布函数是曲线下小于 x0 的面积f(x)xx0F F(x x0 0 )连续型随机变量的期望和方差1.连续型随机变量的数学期望2.方差正态分布正态分布(normal distribution)由由C.F.C.F.高斯高斯(Carl Friedrich Gauss(Carl Friedrich Gauss,177717771855)1855)作为描述误差相对频数分布的模型而提出作为描述误差相对频数分布的模型而提出 描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述许多现象都可以由正态分布来描述 ;许多有用的分布可以由正态分布推导出来;许多有用的分布可以由正态分布推导出来;正态分布在一定条件下还是其他分布的近似分布正态分布在一定条件下还是其他分布的近似分布如:大样本下的如:大样本下的 t t 分布与正态分布近似;分布与正态分布近似;概率密度函数=正态随机变量X的均值=正态随机变量X的方差 ;e=x=随机变量的取值(-x )f(x)X X 正态分布概率密度对应的图形称为正态曲线正态分布概率密度对应的图形称为正态曲线正态曲线的性质正态曲线的性质1.1.图形是关于图形是关于x x=对称钟形曲线,且峰值在对称钟形曲线,且峰值在x x=处处2.2.均均值值 和和标标准准差差 一一旦旦确确定定,分分布布的的具具体体形形式式也也惟惟一一确确定定,不不同同参参数数正正态态分分布布构构成成一一个个完完整整的的“正正态态分分布布族族”3.3.均均值值 可可取取实实数数轴轴上上的的任任意意数数值值,决决定定正正态态曲曲线线的的具具体体位位置置;标标准准差差决决定定曲曲线线的的“陡陡峭峭”或或“扁扁平平”程程度度。越大,正态曲线扁平;越大,正态曲线扁平;越小,正态曲线越高陡峭越小,正态曲线越高陡峭4.4.当当X X的的取取值值向向横横轴轴左左右右两两个个方方向向无无限限延延伸伸时时,曲曲线线的的两个尾端也无限渐近横轴,理论上永远不会与之相交两个尾端也无限渐近横轴,理论上永远不会与之相交5.5.正正态态随随机机变变量量在在特特定定区区间间上上的的取取值值概概率率由由正正态态曲曲线线下下的面积给出,而且其曲线下的总面积等于的面积给出,而且其曲线下的总面积等于1 1 X X 和 对正态曲线的影响xf(x)CAB =1/2=1/2 1 1 1 1 2 2 2 2 =1 =1 正态分布的概率概率是曲线下的概率是曲线下的面积面积面积面积!a ab bx xf f(x x)标准正态分布(standardize the normal distribution)3.3.标准正态分布标准正态分布标准正态分布标准正态分布的概率密度函数的概率密度函数的概率密度函数的概率密度函数1.1.随机变量具有均值为随机变量具有均值为0 0,标准差为,标准差为1 1的正态分布的正态分布2.2.任任何何一一个个一一般般的的正正态态分分布布,可可通通过过下下面面的的线线性性变换转化为标准正态分布变换转化为标准正态分布4.4.标准正态分布标准正态分布标准正态分布标准正态分布的分布函数的分布函数的分布函数的分布函数标准正态分布X X 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 1 1Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 标准正态分布表的使用1.对于标准正态分布,即ZN(0,1),有P(a Zb)b aP(|Z|a)2 a 12.对于负的 z,可由(-z)z得到3.对于一般正态分布,即XN(,),有标准化的例子 P(5 X 6.2)X 55 11一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 1111Z Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0.120.12.0478.0478.0478标准化的例子P(2.9 X 7.1)5 =102.97.1X一般正态分布一般正态分布一般正态分布一般正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布0 0 =1=1-.21-.21Z Z.21.21.1664.1664.1664.0832.0832.0832.0832.0832.0832正态分布(例题分析)【例例例例】假假定定某某公公司司职职员员每每周周的的加加班班津津贴贴服服从从均均值值为为5050元元、标标准准差差为为1010元元的的正正态态分分布布,那那么么全全公公司司中中有有多多少少比比例例的的职职员员每每周周的的加加班班津津贴贴会会超超过过7070元元,又又有有多多少少比比例例的的职职员员每每周周的的加加班班津贴在津贴在4040元到元到6060元之间呢?元之间呢?解:解:解:解:设设=5=50 0,=10=10,X XN N(50,10(50,102 2)4.4 4.4 抽样分布抽样分布1.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布在重复选取容量为在重复选取容量为n n的样本时,由该统计量的所有的样本时,由该统计量的所有可能取值形成的相对频数分布可能取值形成的相对频数分布 2.随机变量是随机变量是 样本统计量样本统计量样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布(sampling distribution)抽样分布的形成过程(sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差比例、方差比例、方差比例、方差样样本本4.4.1 4.4.1 样本统计量的抽样分布样本统计量的抽样分布 (一个总体参数推断时一个总体参数推断时)样本均值的抽样分布样本均值的抽样分布样本比例的抽样分布样本比例的抽样分布样本方差的抽样分布样本方差的抽样分布样本均值的抽样分布1.1.在重复选取容量为在重复选取容量为n n的样本时,由样本均值的所的样本时,由样本均值的所有可能取值形成的相对频数分布有可能取值形成的相对频数分布2.2.一种理论概率分布一种理论概率分布3.3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N=4N=4。4 4 个个个个体体分分别别为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4。总体的均值、方差及分布如下总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2 总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期望为期望为,方差为,方差为 2 2/n n。即。即 x xN N(,2 2/n n)中心极限定理中心极限定理(central limit theorem)(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均值为样分布近似服从均值为、方差为、方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的过程的过程的过程的过程抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布1.样本均值的数学期望2.样本均值的方差重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2 总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x样本均值的抽样分布(数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值样本均值的均值(数学期望数学期望)等于总体均值等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n均值的抽样标准误差1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.也称标准误差2.小于总体标准差3.计算公式为样本比例的抽样分布1.1.总体总体(或样本或样本)中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.2.总体比例可表示为总体比例可表示为3.3.样本比例可表示为样本比例可表示为4.4.比例(proportion)具有某种属性具有某种属性的单位个数的单位个数样本比例的抽样分布1.1.在重复选取容量为在重复选取容量为n n的样本时,由样本比例的所的样本时,由样本比例的所有可能取值形成的相对频数分布称为样本比例的有可能取值形成的相对频数分布称为样本比例的抽样分布。抽样分布。2.2.一种理论概率分布一种理论概率分布3.3.当样本容量很大时,样本比例的抽样分布可用正当样本容量很大时,样本比例的抽样分布可用正态分布近似态分布近似 4.4.推断总体比例推断总体比例 的理论基础的理论基础1.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)样本方差的抽样分布样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为(n-1)的 2分布,即1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来2.设 ,则3.令 ,则 Y 服从自由度为1的2分布,即4.5.当总体 ,从中抽取容量为n的样本,则2分布(2 distribution)1.1.分布的变量值始终为正分布的变量值始终为正 2.2.分分布布的的形形状状取取决决于于其其自自由由度度n n的的大大小小,通通常常为为不不对对称称的的正正偏偏分布,但随着自由度的增大逐渐趋于对称分布,但随着自由度的增大逐渐趋于对称 3.3.期望为:期望为:E E(2 2)=)=n n,方差为:方差为:D D(2 2)=2)=2n n(n n为自由度为自由度)4.4.可可加加性性:若若U U和和V V为为两两个个独独立立的的 2 2分分布布随随机机变变量量,U U服服从从 2 2(n(n1 1),V V服服从从 2 2(n n2 2),),则则U U+V V这这一一随随机机变变量量服服从从自自由由度度为为n n1 1+n n2 2的的 2 2分布分布 2分布(性质和特点)c2分布(图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2=(n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体4.4.2 4.4.2 样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本比例之差的抽样分布两个样本比例之差的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布1.两个总体都为正态分布,即 ,2.两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差3.方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布 1 1 1 1总体总体1 2 2 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算x1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算x2计算每一对样本计算每一对样本的的x1-x2所有可能样本所有可能样本的的x1-x2 1 1 1 1 2 22 2抽样分布抽样分布抽样分布抽样分布两个样本比例之差的抽样分布两个样本比例之差的抽样分布1.两个总体都服从二项分布2.分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似3.分布的数学期望为4.方差为各自的方差之和 两个样本比例之差的抽样分布两个样本比例之差的抽样分布两个样本方差比的抽样分布1.由统计学家费希尔()提出的,以其姓氏的第一个字母来命名则2.设 若 U为 服 从 自 由 度 为 n1的2分 布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 称F为服从自由度n1和n2的F分布,记为F分布(F distribution)F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)两个样本方差比的抽样分布两个样本方差比的抽样分布1.两两个个总总体体都都为为正正态态分分布布,即即X X1 1 N N(1 1,1 12 2),X X2 2 N N(2 2,2 22 2)2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的独立样本的独立样本3.两两个个样样本本方方差差比比的的抽抽样样分分布布,服服从从分分子子自自由由度度为为(n n1 1-1)-1),分母自由度为分母自由度为(n n2 2-1)-1)的的F F分布,即分布,即 由正态分布导出的几个重要分布 2分布分布t 分布分布F 分布分布t 分布t分布也称为学生氏分布,是高塞特提出的。分布也称为学生氏分布,是高塞特提出的。设随机变量设随机变量且且X X与与Y Y独立,则独立,则其分布称为其分布称为t t分布,其中分布,其中n n为自由度。为自由度。t t分布的提出对于小样本理论和应用有着重要的促进作用。分布的提出对于小样本理论和应用有着重要的促进作用。t 分布 t t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z设设的一个样本,的一个样本,则则称为服从自由度为称为服从自由度为n-1的的t分布。分布。一个与一个与t分布有关的抽样分布:分布有关的抽样分布:t 分布1.高塞特()于1908年在一篇以“Student”(学生)为笔名的论文中首次提出2.t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散3.一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 t 分布图示x x xt 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t分布分布标准正态分布标准正态分布t(df=13)t(df=5)z z