《抽样与抽样分布》PPT课件.ppt
6-1统计学统计学STATISTICS(第二版第二版)你不必吃完整一头牛,才知道它的你不必吃完整一头牛,才知道它的肉是咬不动的。肉是咬不动的。Samel Johnson6-2统计学统计学STATISTICS(第二版第二版)第第 6 章章 抽样与抽样分布抽样与抽样分布作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学6-3统计学统计学STATISTICS(第二版第二版)统计应用统计应用“抓阄抓阄”征兵计划征兵计划 在在美美国国的的对对越越战战争争中中,为为使使前前线线有有足足够够的的士士兵兵,美美国国政政府府制制定定了了一一个个“抓抓阄阄”的的征征兵兵计计划划。该该计计划划打打算算把把1 1到到366366的的号号码码随随机机地地分分配配给给一一年年中中每每一一天天,然然后后由由军军事事部部门门按按分分配配的的号号码码顺顺序序把把生生日日与与之之对对应应的的年年轻轻人人分分批批征征召召入入伍伍。这这种种方方法法的的目目的的是是为为了了给给大大家家相相等等的的机机会会卷卷入入这这场场不不受受欢欢迎迎的的战战争争中中,因因此此被被征召的可能性应该是随机的征召的可能性应该是随机的在在第第一一年年的的征征兵兵计计划划中中,号号码码1 1被被分分配配给给了了9 9月月1414日日,分分配配方方法法是是随随机机抽抽取取一一个个大大容容器器中中的的366366个个写写上上了了日日子子的的乒乒乓乓球球。结结果果所所有有年年满满1818岁岁且且生生于于9 9月月1414日日的的合合格格青青年年将将作作为为第第一一批批被被征征召召入入伍伍。生生日日被被分分配配为为号号码码2 2的青年则在第二批被征召入伍,以此类推的青年则在第二批被征召入伍,以此类推6-4统计学统计学STATISTICS(第二版第二版)统计应用统计应用“抓阄抓阄”征兵计划征兵计划我我们们知知道道,并并不不是是所所有有的的人人都都被被征征召召入入伍伍,因因此此,生生日日被分配的号码较大的人也许永远轮不上到军队服役被分配的号码较大的人也许永远轮不上到军队服役这这种种抓抓阄阄看看起起来来对对决决定定应应该该被被征征召召入入伍伍是是一一个个相相当当不不错错的的方方法法。然然而而,在在抓抓阄阄的的第第二二天天,当当所所有有的的日日子子和和它它们们对对应应的的号号码码公公布布以以后后,统统计计学学家家们们开开始始研研究究这这些些数数据据。经经过过观观察察和和计计算算,统统计计学学家家们们发发现现了了一一些些规规律律。例例如如,我我们们本本应应期期望望应应该该有有差差不不多多一一半半的的较较小小的的号号码码(1(1到到183)183)被被分分配配给给前前半半年年的的日日子子,即即从从1 1月月份份到到6 6月月份份;另另外外一一半半较较小小的的号号码码被被分分配配给给后后半半年年的的日日子子,从从7 7月月到到1212月月份份。由由于于抓抓阄阄的的随随机机性性,前前半半年年中中可可能能不不会会分分到到正正好好一一半半较较小的号码,但是应当接近一半小的号码,但是应当接近一半6-5统计学统计学STATISTICS(第二版第二版)统计应用统计应用“抓阄抓阄”征兵计划征兵计划然然而而结结果果是是,有有7373个个较较小小的的号号码码被被分分配配给给了了前前半半年年的的日日子子,同同时时有有110110个个较较小小的的号号码码被被分分配配给给了了后后半半年年的的日日子子。换换句句话话说说,如如果果你你生生于于后后半半年年的的某某一一天天,那那么么,你你因因为为被被分分配配给给一一个个较较小小号号码码而而去去服服兵兵役的机会要大于生于前半年的人役的机会要大于生于前半年的人在在这这种种情情况况下下,两两个个数数字字之之间间只只应应该该有有随随机机误误差差,而而7373和和110110之之间间的的差差别别超超出出了了随随机机性性所所能能解解释释的的范范围围。这这种种非非随随机机性性是是由由于于乒乒乓乓球球在在被被抽抽取取之之前前没没有有被被充充分分搅搅拌拌造造成成的的。在在第第二二年年,主主管管这这件件事事的的部部门门在在抓抓阄阄之之前前去去咨咨询询了了统统计计学学家家(这这可可能能使使生生于于后后半半年的人感觉稍微舒服些年的人感觉稍微舒服些)6-6统计学统计学STATISTICS(第二版第二版)第第 6 章章 抽样与抽样分布抽样与抽样分布6.1 概率抽样方法概率抽样方法6.2 三种不同性质的分布三种不同性质的分布 6.3 一个总体参数推断时样本统计量的抽样一个总体参数推断时样本统计量的抽样 分布分布6.4 两个总体参数推断时样本统计量的抽样两个总体参数推断时样本统计量的抽样 分布分布6-7统计学统计学STATISTICS(第二版第二版)学习目标学习目标1.了解概率抽样方法了解概率抽样方法2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布6-8统计学统计学STATISTICS(第二版第二版)概率抽样方法概率抽样方法6.1.1 简单随机抽样简单随机抽样6.1.2 分层抽样分层抽样6.1.3 系统抽样系统抽样6.1.4 整群抽样整群抽样6-9统计学统计学STATISTICS(第二版第二版)抽样方法抽样方法6-10统计学统计学STATISTICS(第二版第二版)概率抽样概率抽样(probability sampling)1.根据一个已知的概率来抽取样本单位,也称随机抽样2.特点n n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本l l抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中n n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以以计计算算出来的出来的 n n当用样本对总体目标量进行当用样本对总体目标量进行 估计时,要考虑到每个样本估计时,要考虑到每个样本 单位被抽中的概率单位被抽中的概率6-11统计学统计学STATISTICS(第二版第二版)简单随机抽样简单随机抽样(simple random sampling)1.从从总总体体N N个个单单位位(元元素素)中中随随机机地地抽抽取取n n个个单单位位作作为为样样本本,使使得得总总总总体体体体中中中中每每每每一一一一个个个个元元元元素素素素都都有有相相同同的的机机会会(概概率率)被抽中被抽中 2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.特点特点n n简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本n n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性n n当当N N很大时,不易构造抽样框很大时,不易构造抽样框n n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n n没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率6-12统计学统计学STATISTICS(第二版第二版)简单随机样本简单随机样本(simple random sample)1.由简单随机抽样形成的样本2.从总体N个单位中随机地抽取n个单位作为样本,使得每每一一个个容容量量为为n样样本本都有相同的机会(概率)被抽中 3.参数估计和假设检验所依据的主要是简单随机样本6-13统计学统计学STATISTICS(第二版第二版)简单随机抽样简单随机抽样(用用Excel对对分分类类数据随机抽数据随机抽样样)【例例】某某班班级级共共 有有 3030名名学学 生生,他他们们 的的 名名 单单如如 右右 表表。用用 ExcelExcel抽抽出出一一个个由由5 5个个 学学 生生 构构成成 的的 随随 机机样本样本 6-14统计学统计学STATISTICS(第二版第二版)简单随机抽样简单随机抽样(用用Excel对对分分类类数据随机抽数据随机抽样样)第第第第1 1步:步:步:步:将将3030个学生的名单录入到个学生的名单录入到ExcelExcel工作表中的一列工作表中的一列第第第第2 2步:步:步:步:给每个学生一个给每个学生一个数字代码数字代码数字代码数字代码,分别为,分别为1 1,22,3030,并按,并按 顺序排列,将代码录入到顺序排列,将代码录入到ExcelExcel工作表中的一列,与工作表中的一列,与 学生名单相对应学生名单相对应第第第第3 3步:步:步:步:选择【选择【工具工具工具工具】下拉菜单,并选择【】下拉菜单,并选择【数据分析数据分析数据分析数据分析】选项,】选项,然后在【数据分析】选项中选择【然后在【数据分析】选项中选择【抽样抽样抽样抽样】第第第第4 4步:步:步:步:在【抽样】对话框中的【输入区域】中输入学生代码在【抽样】对话框中的【输入区域】中输入学生代码 区域,在【抽样方法】中单击【区域,在【抽样方法】中单击【随机随机随机随机】。在【样本。在【样本 数】中输入需要抽样的学生个数。在【数】中输入需要抽样的学生个数。在【输出区域输出区域输出区域输出区域】中】中 选择抽样结果放置的区域。【确定】后即得到要抽取选择抽样结果放置的区域。【确定】后即得到要抽取 的样本的样本 用用用用ExcelExcel对分类数据抽样对分类数据抽样对分类数据抽样对分类数据抽样6-15统计学统计学STATISTICS(第二版第二版)简单随机抽样简单随机抽样(用用Excel对对数数值值型数据随机抽型数据随机抽样样)第第第第1 1步:步:步:步:将原始数据录入到将原始数据录入到ExcelExcel工作表中的一列工作表中的一列第第第第2 2步:步:步:步:选择【选择【工具工具工具工具】下拉菜单,并选择【】下拉菜单,并选择【数据分析数据分析数据分析数据分析 】选项】选项 ,然后在【数据分析】选项中选择【然后在【数据分析】选项中选择【抽样抽样抽样抽样】第第第第3 3步:步:步:步:在【抽样】对话框中的【输入区域】中输入原始数据在【抽样】对话框中的【输入区域】中输入原始数据 区域,在【抽样方法】中单击【区域,在【抽样方法】中单击【随机随机随机随机】。在【样本】。在【样本 数】中输入需要抽样的数据个数。在【输出区域】数】中输入需要抽样的数据个数。在【输出区域】中选择抽样结果放置的区域。【确定】后即得到要中选择抽样结果放置的区域。【确定】后即得到要 抽取的样本数据抽取的样本数据 用用用用ExcelExcel对数值型数据抽样对数值型数据抽样对数值型数据抽样对数值型数据抽样6-16统计学统计学STATISTICS(第二版第二版)分层抽样分层抽样(stratified sampling)1.将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点n n保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从从而提高估计的精度而提高估计的精度n n组织实施调查方便组织实施调查方便n n既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的目标量进行估计的目标量进行估计6-17统计学统计学STATISTICS(第二版第二版)系统抽样系统抽样(systematic sampling)1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n n先先从从数数字字1 1到到k k之之间间随随机机抽抽取取一一个个数数字字r r作作为为初始单位,以后依次取初始单位,以后依次取r r+k k,r r+2+2k k等单位等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难6-18统计学统计学STATISTICS(第二版第二版)整群抽样整群抽样(cluster sampling)1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点n n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量n n调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调查的实施调查的实施n n缺点是估计的精度较差缺点是估计的精度较差6-19统计学统计学STATISTICS(第二版第二版)多阶段抽样多阶段抽样(multi-stage sampling)1.1.先先抽抽取取群群,但但并并不不是是调调查查群群内内的的所所有有单单位位,而而是是再再进进行行一一步步抽抽样样,从从选选中中的的群群中中抽抽取取出出若若干干个个单单位位进进行调查行调查n n群群是是初初级级抽抽样样单单位位,第第二二阶阶段段抽抽取取的的是是最最终终抽抽样样单单位位。将该方法推广,使抽样的段数增多,就称为多阶段抽样将该方法推广,使抽样的段数增多,就称为多阶段抽样2.2.具具有有整整群群抽抽样样的的优优点点,保保证证样样本本相相对对集集中中,节节约约调调查费用查费用3.3.需需要要包包含含所所有有低低阶阶段段抽抽样样单单位位的的抽抽样样框框;同同时时由由于于实行了再抽样,使调查单位在更广泛的范围内展开实行了再抽样,使调查单位在更广泛的范围内展开4.4.在大规模的抽样调查中,经常被采用的方法在大规模的抽样调查中,经常被采用的方法 6-20统计学统计学STATISTICS(第二版第二版)三种不同性质的分布三种不同性质的分布6.2.1 总体分布总体分布6.2.2 样本分布样本分布6.2.3 抽样分布抽样分布6-21统计学统计学STATISTICS(第二版第二版)1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体6-22统计学统计学STATISTICS(第二版第二版)1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布(sample distribution)样样本本6-23统计学统计学STATISTICS(第二版第二版)1.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布n n在重复选取容量为在重复选取容量为n n的样本时,由该统计量的所有的样本时,由该统计量的所有可能取值形成的相对频数分布可能取值形成的相对频数分布 2.随机变量是随机变量是 样本统计量样本统计量样本统计量样本统计量n n样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同容量相同容量相同容量相同的的所有所有所有所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布抽样分布 (sampling distribution)6-24统计学统计学STATISTICS(第二版第二版)抽样分布的形成过程抽样分布的形成过程 (sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本6-25统计学统计学STATISTICS(第二版第二版)样本统计量的抽样分布样本统计量的抽样分布 (一个总体参数推断时一个总体参数推断时)6.3.1 样本均值的抽样分布样本均值的抽样分布6.3.2 样本比例的抽样分布样本比例的抽样分布6.3.3 样本方差的抽样分布样本方差的抽样分布6-26统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布6-27统计学统计学STATISTICS(第二版第二版)1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布6-28统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总总体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差6-29统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值所有可能的所有可能的所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)6-30统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.56-31统计学统计学STATISTICS(第二版第二版)样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2 总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x6-32统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期望为期望为,方差为,方差为 2 2/n n。即。即 x xN N(,2 2/n n)6-33统计学统计学STATISTICS(第二版第二版)中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似似服服从从均均值为值为,方差为,方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x6-34统计学统计学STATISTICS(第二版第二版)中心极限定理中心极限定理 (central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的过程的过程的过程的过程6-35统计学统计学STATISTICS(第二版第二版)抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本样本均值样本均值正态分布正态分布样本均值样本均值正态分布正态分布样本均值样本均值非正态分布非正态分布6-36统计学统计学STATISTICS(第二版第二版)1.样本均值的数学期望2.样本均值的方差n n重复抽样重复抽样n n不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)6-37统计学统计学STATISTICS(第二版第二版)样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值样本均值的均值(数学期望数学期望)等于总体均值等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n6-38统计学统计学STATISTICS(第二版第二版)统计量的标准误统计量的标准误 (standard error)1.样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差2.标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度3.以样本均值的抽样分布为例,在重复抽样条件下,样本均值的标准误为6-39统计学统计学STATISTICS(第二版第二版)估计的标准误估计的标准误 (standard error of estimation)1.当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误2.以样本均值的抽样分布为例,当总体标准差当总体标准差 未知时,可用样本标准差未知时,可用样本标准差s s代替,则代替,则在重复抽样条件下,样本均值的估计标准误样本均值的估计标准误为6-40统计学统计学STATISTICS(第二版第二版)样本比例的抽样分布样本比例的抽样分布6-41统计学统计学STATISTICS(第二版第二版)1.总体总体(或样本或样本)中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为4.比例比例(proportion)6-42统计学统计学STATISTICS(第二版第二版)1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似 4.推断总体比例的理论基础样本比例的抽样分布样本比例的抽样分布6-43统计学统计学STATISTICS(第二版第二版)1.样本比例的数学期望2.样本比例的方差n n重复抽样重复抽样n n不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)6-44统计学统计学STATISTICS(第二版第二版)样本方差的抽样分布样本方差的抽样分布6-45统计学统计学STATISTICS(第二版第二版)样本方差的分布样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为(n-1)的 2分布,即6-46统计学统计学STATISTICS(第二版第二版)1.1.由由阿阿贝贝(AbbeAbbe)于于18631863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(HermertHermert)和和 卡卡 皮皮 尔尔 逊逊(KPearsonKPearson)分分 别别 于于18751875年和年和19001900年推导出来年推导出来2.2.设设 ,则,则3.3.令令 ,则,则 Y Y 服从自由度为服从自由度为1 1的的 2 2分布,即分布,即4.4.4.4.当总体当总体 ,从中抽取容量为,从中抽取容量为n n的样本,则的样本,则 2分布分布(2 distribution)6-47统计学统计学STATISTICS(第二版第二版)1.分布的变量值始终为正分布的变量值始终为正 2.分分布布的的形形状状取取决决于于其其自自由由度度n n的的大大小小,通通常常为为不不对对称称的的正正偏偏分分布布,但但随随着着自自由由度度的的增增大大逐逐渐渐趋趋于对称于对称 3.期望为期望为E E(2 2)=)=n n,方差为方差为D D(2 2)=2)=2n n(n n为自由度为自由度)4.可可加加性性:若若U U和和V V为为两两个个独独立立的的服服从从 2 2分分布布的的随随机机变变量量,U U 2 2(n(n1 1),V V 2 2(n n2 2),),则则U U+V V这这一一随随机变量服从自由度为机变量服从自由度为n n1 1+n n2 2的的 2 2分布分布 2分布分布(性质和特点性质和特点)6-48统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(图示图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2=(n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体6-49统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(例题的图示例题的图示)1616个样本方差的分布个样本方差的分布个样本方差的分布个样本方差的分布样本方差样本方差s s2 2s s2 2取值的概率取值的概率0.00.04/164/160.50.56/166/162 24/164/164.54.52/162/166-50统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(用用Excel计算计算c c2 2分布的概率分布的概率)1.利利用用ExcelExcel提提供供的的CHIDISTCHIDIST统统计计函函数数,计计算算c c2 2分分布布右单尾的概率值右单尾的概率值2.语语法法为为CHIDIST(CHIDIST(x x,dfdf),其其中中dfdf为为自自由由度度,x x是是随随机变量的取值机变量的取值3.给给定定自自由由度度和和统统计计量量取取值值的的右右尾尾概概率率,也也可可以以利利用用“插入函数插入函数”命令来实现命令来实现4.计算自由度为计算自由度为8 8,统计量的取值大于,统计量的取值大于1010的概率的概率 用用用用ExcelExcel计算计算计算计算c c c c2 2 2 2 分布的概率分布的概率分布的概率分布的概率6-51统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(用用Excel计算计算c c2 2分布的临界值分布的临界值)1.利利用用ExcelExcel提提供供的的CHIINVCHIINV统统计计函函数数,计计算算分分布布右右单尾的概率值为单尾的概率值为 的临界值的临界值2.语法为语法为CHIINV(CHIINV(,dfdf),其中其中dfdf为自由度为自由度3.给给定定自自由由度度和和分分布布右右尾尾概概率率为为 的的临临界界值值也也可可以以利用利用“插入函数插入函数”命令来实现命令来实现4.计算自由度为计算自由度为1010,右尾概率为,右尾概率为的临界值的临界值 用用用用ExcelExcel计算计算计算计算c c c c2 2 2 2 分布的临界值分布的临界值分布的临界值分布的临界值6-52统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(用用Excel生成生成c c2 2分布的临界值表分布的临界值表)第一步:第一步:将c c2 2分布自由度df的值输入到工作表的 A列,将右尾概率的取值输入到第1行第二步第二步:在B2单元格输入公式 “=CHIINV(B$1,$A2)”然后将其向下、向右复制即可得到分布 的临界值表 用用用用ExcelExcel生成生成生成生成c c c c2 2 2 2 分布的临界值表分布的临界值表分布的临界值表分布的临界值表6-53统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(用用Excel绘制绘制c c2 2分布图分布图)第第第第1 1步:步:步:步:在工作表的第在工作表的第1 1列列A2A2:A62A62输入应一个等差数列,初始输入应一个等差数列,初始 值为值为“0”“0”,步长为,步长为“1”“1”,终值为,终值为“60”“60”第第第第2 2步:步:步:步:在单元格在单元格B1B1输入输入c2c2分布自由度分布自由度(如如“15”)“15”)第第第第3 3步:步:步:步:在单元格在单元格B2B2输入公式输入公式“=CHIDIST(A2,$B$1)”“=CHIDIST(A2,$B$1)”,并将其,并将其 复制到复制到B3B3:B62B62区域区域第第第第4 4步:步:步:步:在单元格在单元格C2C2输入公输入公“=B2-B3”“=B2-B3”,并将其复制到,并将其复制到C3C3:C62 C62 区域区域第第第第5 5步:步:步:步:将将A2A2:A62A62作为横坐标、作为横坐标、C2C2:C62C62作为纵坐标,根据作为纵坐标,根据“图表向导图表向导”绘制折线图绘制折线图 用用用用用用ExcelExcelExcel绘制绘制绘制绘制绘制绘制c2c2c2c2c2c2分布图分布图分布图分布图分布图分布图6-54统计学统计学STATISTICS(第二版第二版)c c2 2分布分布(用用Excel绘制绘制c c2 2分布图分布图)6-55统计学统计学STATISTICS(第二版第二版)样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)6.4.1 两个样本均值之差的抽样分布两个样本均值之差的抽样分布6.4.2 两个样本比例之差的抽样分布两个样本比例之差的抽样分布6.4.3 两个样本方差比的抽样分布两个样本方差比的抽样分布6-56统计学统计学STATISTICS(第二版第二版)两个样本均值之差的抽样分布两个样本均值之差的抽样分布6-57统计学统计学STATISTICS(第二版第二版)1.两个总体都为正态分布,即两个总体都为正态分布,即 ,2.两两个个样样本本均均值值之之差差 的的抽抽样样分分布布服服从从正正态态分分布,其分布的数学期望为两个总体均值之差布,其分布的数学期望为两个总体均值之差3.方差为各自的方差之和方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布6-58统计学统计学STATISTICS(第二版第二版)两个样本均值之差的抽样分布两个样本均值之差的抽样分布 1 1 1 1总体总体1 2 2 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算x1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算x2计算每一对样本计算每一对样本的的x1-x2所有可能样本所有可能样本的的x1-x2 1 1 1 1-2 22 2抽样分布抽样分布抽样分布抽样分布6-59统计学统计学STATISTICS(第二版第二版)两个样本比例之差的抽样分布两个样本比例之差的抽样分布6-60统计学统计学STATISTICS(第二版第二版)1.1.两个总体都服从二项分布两个总体都服从二项分布2.2.分分别别从从两两个个总总体体中中抽抽取取容容量量为为n n1 1和和n n2 2的的独独立立样样本本,当当两两个个样样本本都都为为大大样样本本时时,两两个个样样本本比比例例之之差差的的抽抽样分布可用正态分布来近似样分布可用正态分布来近似3.3.分布的数学期望为分布的数学期望为4.4.方差为各自的方差之和方差为各自的方差之和 两个样本比例之差的抽样分布两个样本比例之差的抽样分布6-61统计学统计学STATISTICS(第二版第二版)两个样本方差比的抽样分布两个样本方差比的抽样分布6-62统计学统计学STATISTICS(第二版第二版)两个样本方差比的抽样分布两个样本方差比的抽样分布1.两两个个总总体体都都为为正正态态分分布布,即即X X1 1 N N(1 1,1 12 2),X X2 2 N N(2 2,2 22 2)2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的独立样本的独立样本3.两两个个样样本本方方差差比比的的抽抽样样分分布布,服服从从分分子子自自由由度度为为(n n1 1-1)-1),分母自由度为分母自由度为(n n2 2-1)-1)的的F F分布,即分布,即 6-63统计学统计学STATISTICS(第二版第二版)1.1.由由统统计计学学家家费费希希尔尔()提提出出的的,以以其其姓姓氏氏的的第第一一个个字字母来命名母来命名2.2.设设若若U U为为服服从从自自由由度度为为n n1 1的的 2 2分分布布,即即U U 2 2(n n1 1),V V为为服服从从自自由由度度为为n n2 2的的 2 2分分布布,即即V V 2 2(n n2 2),),且且U U和和V V相互独立,则相互独立,则 称称F F为服从自由度为服从自由度n n1 1和和n n2 2的的F F分布,记为分布,记为F分布分布(F distribution)6-64统计学统计学STATISTICS(第二版第二版)F分布分布(图示图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)6-65统计学统计学STATISTICS(第二版第二版)F 分布分布(用用Excel计算计算F分布的概率分布的概率)1.利利用用ExcelExcel提提供供的的FDISTFDIST统统计计函函数数,计计算算分分布布右右单单尾的概率值尾的概率值2.其其语语法法为为FDIST(FDIST(x x,df1,df2),df1,df2),其其中中x x是是随随机机变变量量的的取值,取值,df1df1为分子自由度,为分子自由度,df2df2为分母自由度为分母自由度3.给给定定分分子子自自由由度度df1df1、分分母母自自由由度度df2df2和和统统计计量量取取值值的的右右尾尾概概率率,也也可可以以利利用用“粘粘贴贴函函数数”命命令令来来实现实现4.计计算算分分子子自自由由度度为为4 4,分分母母自自由由度度为为6 6,统统计计量量的的取值大于取值大于的概率的概率 用用用用ExcelExcel计算计算计算计算F F分布的概率分布的概率分布的概率分布的概率6-66统计学统计学STATISTICS(第二版第二版)F 分布分布(用用Excel计算计算F分布的临界值分布的临界值)1.利利用用ExcelExcel提提供供的的FINVFINV统统计计函函数数,计计算算分分布布右右单单尾的概率值为尾的概率值为 的临界值的临界值2.其其语语法法为为FINV(FINV(,df1,df2),df1,df2),其其中中df1df1为为分分子子自自由度,由度,df2df2为分母自由度为分母自由度3.给给定定分分子子自自由由度度、分分