随机抽样和抽样分布.ppt
随机抽样和抽样分布现在学习的是第1页,共27页一、总体与样本一、总体与样本1、总体与个体、总体与个体被研究对象的全体称为总体,组成总体的每一个元素称被研究对象的全体称为总体,组成总体的每一个元素称为个体。为个体。总体总体有限总体:个体数是有限的(当个体有限总体:个体数是有限的(当个体数非常多时,可视为无限总体)数非常多时,可视为无限总体)无限总体无限总体现在学习的是第2页,共27页一、统计量一、统计量 人们取得样本后,并不能直接利用它作出人们取得样本后,并不能直接利用它作出对总体分布的推断或分布参数的估计,而是对取得对总体分布的推断或分布参数的估计,而是对取得的数据进行数学加工,改造成具有较好性质且便于的数据进行数学加工,改造成具有较好性质且便于应用的形式。在数理统计学中,往往通过构造一个应用的形式。在数理统计学中,往往通过构造一个合适的依赖于样本的函数来解决问题,这个函数合适的依赖于样本的函数来解决问题,这个函数称为统计量。称为统计量。1、定义、定义 设设 为取自总体为取自总体X的样本,的样本,g=是样本函数,且函数中不含是样本函数,且函数中不含任何未知参数,则称任何未知参数,则称g 为一个统计量。为一个统计量。现在学习的是第3页,共27页2 2、样本、样本从同一总体中抽取出若干个体组成的集合称为从同一总体中抽取出若干个体组成的集合称为样本样本。样本中每一个体称为样本中每一个体称为样品样品。样本中包含的样品个数称为样本中包含的样品个数称为样本容量样本容量。例如,从某批例如,从某批1万只显像管中抽取万只显像管中抽取100只做寿命只做寿命调查。调查。其中,样本为:其中,样本为:100只显像管的寿命只显像管的寿命样品:样品:抽取出的每一只显像管的寿命抽取出的每一只显像管的寿命样本容量:样本容量:100只只现在学习的是第4页,共27页3、随机抽样、随机抽样简单随机样本简单随机样本 从总体中抽取样本可以有不同的方法,为了使从总体中抽取样本可以有不同的方法,为了使样本能对总体作出比较可靠的推断,对抽样方法有样本能对总体作出比较可靠的推断,对抽样方法有以下要求:以下要求:(1)抽样是随机的。即总体的每一个体都等可能)抽样是随机的。即总体的每一个体都等可能地被抽取;地被抽取;(2)样本的分量)样本的分量 是相互独立的随是相互独立的随机变量,即每一分量的观测结果并不影响其它分量机变量,即每一分量的观测结果并不影响其它分量的观测结果。的观测结果。这样的抽样称为简单随机抽样,得到的样本这样的抽样称为简单随机抽样,得到的样本称为简单随机样本。称为简单随机样本。现在学习的是第5页,共27页结论:结论:若若 是从总体是从总体X X中抽取的中抽取的简单随机样本。则简单随机样本。则 相互独立,且每一个与相互独立,且每一个与X X同分布。同分布。抽取样本的方式有放回和不放回两种。抽取样本的方式有放回和不放回两种。从无限总体中无论是放回还是不放回,得到的样本都可看从无限总体中无论是放回还是不放回,得到的样本都可看成简单随机样本。成简单随机样本。从有限总体中,放回抽样得到简单随机样本;从有限总体中,放回抽样得到简单随机样本;不放回抽样得到的不是简单随机样本。但当总体容量很大,不放回抽样得到的不是简单随机样本。但当总体容量很大,样本容量样本容量n n较小(通常)时,不放回抽样可近似较小(通常)时,不放回抽样可近似看成放回抽样。看成放回抽样。现在学习的是第6页,共27页二、样本的数字特征二、样本的数字特征1 1、样本均数、样本均数2 2、样本方差、样本方差样本标准差样本标准差样本变异系数样本变异系数现在学习的是第7页,共27页例例 开胸顺气丸崩解时间开胸顺气丸崩解时间XN(,2)随机抽取随机抽取5丸崩丸崩解时间为解时间为:36,40,32,41,36(min),求样本均值与样本方差求样本均值与样本方差解解 36 40 32 41 3636 40 32 41 361296 1600 1024 1681 12961296 1600 1024 1681 1296现在学习的是第8页,共27页3 3、标准误:样本均数的标准差,记为、标准误:样本均数的标准差,记为且有且有证明:设总体均数为证明:设总体均数为EX=EX=,方差,方差DX=DX=即得证即得证 但在实际抽样研究中,但在实际抽样研究中,DXDX通常未知,故采用样本通常未知,故采用样本标准差标准差S S来代替总体标准差来代替总体标准差 ,因此得到标准误的,因此得到标准误的计算公式为计算公式为现在学习的是第9页,共27页4 4、其它常用的数字特征、其它常用的数字特征众数众数 它是随机变量的概率函数或概率密度函数取最它是随机变量的概率函数或概率密度函数取最大值所对应的变量值大值所对应的变量值极差极差 它等于随机变量有限个样本中最大值与最小它等于随机变量有限个样本中最大值与最小值之差值之差中位数中位数 它是累积概率分布它是累积概率分布 或者分布函数或者分布函数 等于等于50%50%所对应的变量值。换言所对应的变量值。换言之,随机变量的取值大于它的概率和小于它的概率之,随机变量的取值大于它的概率和小于它的概率恰好相等,在概率意义上它位于正中。恰好相等,在概率意义上它位于正中。现在学习的是第10页,共27页(2 2)若)若 ,则,则5 5、与与 的运算性质的运算性质(1 1)若样本值)若样本值 (i=1,2,n)i=1,2,n)则则证明略证明略现在学习的是第11页,共27页一、正态变量的独立可加性一、正态变量的独立可加性设设n n个相互独立的变量都服从正态分布,个相互独立的变量都服从正态分布,(i=1,2,n)i=1,2,n)其中其中 (i=1,2,n)是不全为零的常数。是不全为零的常数。2 2、正态变量、正态变量X X的线性函数的线性函数Y=aX+bY=aX+b仍服从正态分布,仍服从正态分布,且且则它们的的线性组合仍服从正态分布则它们的的线性组合仍服从正态分布,即即 现在学习的是第12页,共27页设总体设总体 ,是从总体中是从总体中取出的样本,则取出的样本,则说明说明:对于非正态总体,当抽样为小样本时,没有:对于非正态总体,当抽样为小样本时,没有确定性结论;当抽样为大样本时,有确定性结论;当抽样为大样本时,有即对于大样本,无论总体服从何分布,上式总即对于大样本,无论总体服从何分布,上式总成立。成立。现在学习的是第13页,共27页例例 设从总体设从总体 中随机抽取一容量中随机抽取一容量为为25的样本,求样本均值的样本,求样本均值 落于落于(140,147.5)的的概率。概率。解解 由由 ,得,得现在学习的是第14页,共27页二、二、(卡方)分布(卡方)分布1 1、定义定义 设总体设总体X N(0,1)X N(0,1),是取自是取自X X的的样本,则称样本,则称 服从自由度为服从自由度为n n的的 分布。分布。记作记作自由度自由度:统计量中独立随机变量的个数:统计量中独立随机变量的个数约束条件个数约束条件个数例如,样本方差例如,样本方差 中有中有n n个独立的变个独立的变量量 ,它们之间存在唯一的约束条件,它们之间存在唯一的约束条件故故 的自由度为的自由度为n n1 1现在学习的是第15页,共27页 分布的概率密度函数为分布的概率密度函数为概率密度曲线图概率密度曲线图n n越小,曲线越偏向越小,曲线越偏向左侧,当左侧,当n n充分大时,充分大时,分布近似于正态分布近似于正态分布。分布。现在学习的是第16页,共27页2、独立、独立 变量的可加性变量的可加性若若 ,且且 与与 相互独立。相互独立。则则推广到推广到k个变量,若个变量,若 ,i=1,2,k则则3、定理定理 设设 是取自总体是取自总体 的的样本,则样本,则证明略证明略现在学习的是第17页,共27页三、三、t t分布分布1、定义定义 设设 ,U与与V 相互独立,则相互独立,则 服从自由度为服从自由度为n的的t分布。分布。记作记作 tt(n)。t t分布的密度函数为分布的密度函数为现在学习的是第18页,共27页当当n充分大时充分大时,其图形其图形类似于标准正态变量类似于标准正态变量概率密度函数的图形概率密度函数的图形.概率密度曲线图概率密度曲线图显然,图形是关于显然,图形是关于t=0t=0对称的。对称的。现在学习的是第19页,共27页定理定理1 设设 是取自总体是取自总体 的的样本,则样本,则证证现在学习的是第20页,共27页定理定理2 2(两个正态总体的抽样分布)(两个正态总体的抽样分布)1、设、设 与与 是分别取自是分别取自总体总体 ,的相互独立的相互独立简单随机样本,则简单随机样本,则标准化标准化现在学习的是第21页,共27页2 2、其中其中 设设 与与 是分别取自是分别取自总体总体 ,的相互独立的相互独立简单随机样本,则简单随机样本,则称为联合方差称为联合方差现在学习的是第22页,共27页证证现在学习的是第23页,共27页现在学习的是第24页,共27页三、三、F F分布分布其中其中 称为第一自由度,称为第一自由度,称为第二自由度。称为第二自由度。定义定义现在学习的是第25页,共27页 2、定理定理 设设 与与 是是分别取自总体分别取自总体 ,的相互独立简单随机样本,则的相互独立简单随机样本,则性质性质F F分布极限分布也是分布极限分布也是正态分布正态分布.现在学习的是第26页,共27页证证由以前学过的结论知由以前学过的结论知现在学习的是第27页,共27页