统计学之抽样与总体参数的估计38825.pptx
《统计学之抽样与总体参数的估计38825.pptx》由会员分享,可在线阅读,更多相关《统计学之抽样与总体参数的估计38825.pptx(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 抽样与总体参数的估计抽样与总体参数的估计统计推断是统计学研究的重要内容。抽样是进行统计统计推断的基础工作。参数估计是统计推断的重要内容之一。6.1 抽样与抽样分布6.2 参数的估计方法6.3 总体均值和总体比例的区间估计6.4 两个总体均值及两个总体比例之差的估计6.5 正态总体方差及两个正态总体方差比的区间估计6.6 相关系数的区间估计6.1 抽样与抽样分布6.1.1 总体、个体和样本总体(Population)-要研究的事物或现象的总体。个体(Item unit)-组成总体的每个元素(成员)。总体容量(Population size)-一个总体中所含个体的数量。样本(Samp
2、le)-从总体中抽取的部分个体。样本容量(Sample size)-样本中所含个体的数量。抽样(Sampling)-为推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体的过程。统计量(Statistic)-由样本构造,用来估计总体参数的函数。统计量是样本的函数,只依赖于样本;统计量不含任何参数。样本均值、样本方差等都是统计量。6.1.2 抽样方法抽样设计与全面调查相比有如下特点:(1)节省人力及费用;(2)节省时间,提高调查研究的时效性;(3)保证研究结果的准确性。抽样方法分为两类:概率抽样和非概率抽样1、概率抽样根据已知的概率选取被调查者;最理想、最科学的抽样方法;能保证样本数据
3、对总体的代表性;能有效控制抽样误差,将其限制在一定范围内;缺点是:相对非概率抽样,花费较大。概率抽样的几种形式:(1)简单随机抽样(Simple random sampling)完全随机地选取样本,要求有一个完美的抽样框或有总体中每一个个体的详尽名单。可以采取抽签或随机数字表的办法实现。(2)分层抽样(Reduced sampling)先将总体分成不同的“层”,然后,在每一“层”内进行简单随机抽样。可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。(3)整群抽样(Cluster Sampling)在整群抽样中,总体首先被分成称作群的独立的元素组,总体中的每一元素属于且仅属于某一群。抽取
4、一个以群为元素的简单随机样本,样本中的所有元素组成样本。在理想状态下,每一群是整个总体小范围内的代表。(4)系统抽样(Systematic sampling)又称等距抽样。从前k个元素中随机选一个,然后在样本框中每隔一定距离抽取一个。2、非概率抽样不是完全按随机原则选取样本。(1)方便抽样(Convenience sampling)由调查人员自由、方便地选择被调查者的非随机选样。(2)判断抽样(Judgement sampling)通过某些条件过滤选择某些被调查者参与调查的判断抽样法。建议使用概率抽样方法:简单随机抽样、分层抽样、整群抽样或系统抽样。从所估总体特征与样本结果的接近程度上讲,公式
5、可用于估计抽样结果的“优良性”。而用方便抽样和判断抽样方法不能对该“优良性”进行估计。因而,当解释由非概率抽样方法得到的结果时,要特别小心。6.1.3 样本均值的分布与中心极限定理1、样本均值X分布的含义采用随机抽样的方法,从总体中抽取大小为n的一个样本,计算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个体,又可以计算出平均值X2,再将n个个体放回去,再抽取n个个体,如此可以计算出无限个X,这些样本均值X所有可能值的概率分布叫均值X的抽样分布.设X1,X2,Xn为某总体中抽取的随机样本,X1,X2,Xn为相互独立,且与总体有相同分布的随机变量.(1)当总体为正态分布N(,2)时,X的
6、抽样分布仍为正态分布,当越来越大时,X的离散程度越来越小,即用X估计越准确。(2)当总体的分布不是正态分布时,只要样本容量足够大时,样本均值的分布总是近似正态分布,此时要求总体方差2有限。假定总体均值为,方差为2中心极限定理中心极限定理(Central Limit theorem):设从均值为,方差为2(有限)的任意一个总体中抽取大小为的样本,当充分大时(n30),样本均值X的抽样分布近似服从均值为,方差为2/的正态分布。x什么叫充分大呢?总体偏离正态越远,则要求就越大。在实际应用中常要求30。例6.1 从一个均值=8,=0.6的总体中随机选取容量为25的样本。假定该总体不是很偏的,求:(1)
7、样本均值 小于7.9的近似概率;(2)超过7.9的近似概率;(3)在总体均值=8附近0.1范围内的概率.解:根据中心极限定理,在总体不很偏的情况下,(1)(2)(3)例6.2 某厂声称生产的电池=54个月,=6个月的寿命分布。某消费团体为检验该厂的说法是否准确,购买了50个该厂生产的电池进行试验。(1)若厂商声称是正确的,描述50个电池寿命的抽样分布;(2)若厂商声称是正确的,则50个样品组成的样本的平均寿命不超过52个月的概率是多少?解:=54,=6,小概率事件如果真观察到50个电池平均寿命低于52个月,则有理由怀疑厂方说法的正确性。例6.3 某电梯承受的最大拉力为1000千克,可乘坐13人
8、。已知人群的平均体重为60千克,标准差为14千克,且服从正态分布。问电梯发生事故的概率是多少?解:=60,=14,13 则该电梯发生事故的概率为0.0000076.1.4 样本方差的分布样本方差的分布较复杂,它与总体分布有关。在这里只研究当总体为正态分布时,样本方差的分布。(1)样本方差的分布设X1,X2,,Xn为来自正态分布N(,2)的样本,则从数学上可以推导出正态总体下样本方差S2的分布为:(未分组数据)(组距分组数据)(2)卡方分布设X1,X2,,Xn为来自正态分布N(0,1)的一个样本,为自由度为n的卡方分布,自由度n是相互独立的正态变量的个数.卡方分布的特点:1)卡方分布是一个正偏态
9、分布。随自由度n的不同,其分布曲线的形状不同,n小,分布偏斜;n很大,接近于正态分布。当自由度df=n +时,卡方分布即为正态分布。2)值都是正值;3)k个 分布的和也是 分布,即是服从自由度df=df1+df2+dfk的 分布。表明 分布具有可加性。4)0卡方分布表给出了卡方变量在不同自由度下的临界值.当n很大时,近似服从实用上,n45时,Up为正态分布的p分位数。6.1.5 两个方差比的分布设 来自正态总体 的一个样本;来自正态总体 的一个样本且Xi(i=1,2,n1)与Yi(i=1,2,n2)相互独立,则F(n1-1,n2-1)为第一自由度(分子自由度)为n1-1,为第二自由度(分母自由
10、度)为n2-1的F分布。F分布的定义分布的定义F分布的特点:(1)F分布形态是正偏态分布,形式随n1,n2不同而不同,随df1,df2的增加而渐趋正态分布;(2)F为两个方差比率,所以为正值;(3)当df1=1,df2任意时,F值与自由度为df2的t值的平方相等,即F(1,df2)=t2(df2)(4)F分布是统计学家费歇尔(R.A.Fisher)于1924年首先发现的。F分布在假设检验、区间估计、方差分析、回归分析及试验设计等数理统计领域有重要的作用。6.1.6 T统计量的分布设X1,X2,,Xn是来自正态总体N(,2)的一个样本,称为T统计量,它服从自由度为n-1的t分布,即 Tt(n-1
11、)意义:当正态总体方差2已知时,样本平均数的分布为正态分布X N(,2/n);当总体方差2未知时,用S2作为2的估计值,当样本容量小于30时,分布 不接近正态分布,而是自由度为n-1的t分布,n30时接近正态分布,n趋向于无穷时,它是正态分布。t分布的特点:(1)对称。左侧为负,右侧为正,均值为0;(2)-t30时,t分布为接近正态分布,方差1,n-145时,t分布与正态分布没有多大差异在小样本n30时,t分布具有重要作用。6.2 参数估计方法参数估计方法6.2.1 点估计(Point estimate)当总体参数不清楚时,用一个特定值,一般常用样本统计量进行估计,叫点估计。设为总体X的待估计
12、参数,一般用样本X1,X2,Xn构造一个统计量 来估计,则称为的估计量,对于样本的一组数据x1,x2,xn,估计量的值(x1,x2,xn)称为的估计值。如用样本平均数估计总体参数,用样本标准差估计总体标准差一个好的估计量应具备下列特性:(1)一致性(Consistency)当样本容量无限增大时,估计值越来越接近所估计的总体参数.(2)无偏性(Unbiasedness)估计值的平均值与真值一致.(3)有效性(Effectiveness)当总体参数的无偏估计不只一个统计量时,无偏估计变异最小者有效性高,变异大者有效性低.(4)充分性指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体
13、的信息.6.2.2 区间估计(Interval estimate)点估计总是以误差存在为前提,而不能提供正确估计的概率。没有解决参数估计的精确度和可靠性问题。而区间估计可以弥补这一不足之处。区间估计就是用一个区间去估计未知参数,它不具体指出总体参数等于什么,但能指出总体的未知参数落入某一区间的概率有多大。设x1,x2,xn是来自密度f(x,)的样本,对于给定的,0 1,如能找到两个统计量1(x1,x2,xn)和2(x1,x2,xn),使得P1(x1,x2,xn)30(大样本)时,样本均值近似服从正态分布置信区间为:或例6.4母总体为正态分布,=7.07,抽取两个样本n1=10,X1=78,n2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 总体 参数 估计 38825
限制150内