抽样原理与方法.pptx
《抽样原理与方法.pptx》由会员分享,可在线阅读,更多相关《抽样原理与方法.pptx(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、LOGO抽抽 样样 原原 理理 与与 方方 法法LOGO主要主要内内容容u抽样误差的估计抽样误差的估计u样本容量的确定样本容量的确定u抽样的基本方法抽样的基本方法u抽样方案的制定抽样方案的制定1抽样误差的估计抽样误差的估计u假设有一正态总体,对其进行假设有一正态总体,对其进行k次抽样,次抽样,每个样本包含每个样本包含n个观测值,则可得到样本个观测值,则可得到样本1、样本样本2、样本、样本k。u这这k个样本的平均数可能各不相同,且其个样本的平均数可能各不相同,且其中某个样本的平均数刚好等于总体平均数中某个样本的平均数刚好等于总体平均数的几率也很小。的几率也很小。u样本统计数与总体参数的差别主要由
2、样本统计数与总体参数的差别主要由“抽抽样误差样误差”所引起。抽样误差与总体参数的所引起。抽样误差与总体参数的估计有着密切关系。估计有着密切关系。样本平均数的标准误和置信区间样本平均数的标准误和置信区间u从理论上说,各样本平均数的平从理论上说,各样本平均数的平均数是对总体平均数的最好估计均数是对总体平均数的最好估计值,即:值,即:u且容量为且容量为n的样本平均数的方差的样本平均数的方差等于总体方差的等于总体方差的1/n,即:,即:x22xxnn样本平均数的标准误和置信区间样本平均数的标准误和置信区间u在实际工作中,从总体中抽出多个样本计在实际工作中,从总体中抽出多个样本计算均值和标准误往往是不现
3、实的。故常采算均值和标准误往往是不现实的。故常采用一个样本的标准差来估计平均数的标准用一个样本的标准差来估计平均数的标准误,即:误,即:xxssn样本平均数的标准误和置信区间样本平均数的标准误和置信区间( , )( , )axaxaxaxxuxuxtxtu则总体平均数在(则总体平均数在(1-)置信水平上的置信区)置信水平上的置信区间为:间为:样本频率的标准误和置信区间样本频率的标准误和置信区间u对于以频率表示的资料,当资料的观测值对于以频率表示的资料,当资料的观测值个数相当大时,其分布也接近正态分布,个数相当大时,其分布也接近正态分布,其标准误的计算公式为:其标准误的计算公式为:ppqsn样本
4、频率的标准误和置信区间样本频率的标准误和置信区间( , )apappu spu su则总体频率在(则总体频率在(1-)置信水平上的置信区间)置信水平上的置信区间为:为:2平均数资料样本容量的确定平均数资料样本容量的确定0.05tsLnu确定样本容量前,必须先明确能够接受误差的确定样本容量前,必须先明确能够接受误差的范围,并了解两类错误的概率和变量标准差的范围,并了解两类错误的概率和变量标准差的大小,并根据试验和经验作出估计。大小,并根据试验和经验作出估计。0.05 xxsLtssn平均数资料样本容量的确定平均数资料样本容量的确定u在在L(置信半径)的计算公式中,(置信半径)的计算公式中,s一一
5、般根据前人经验或小型试验取得;般根据前人经验或小型试验取得;n一般取无穷大,则一般取无穷大,则t0.051.962。可得:可得:u若计算所得若计算所得n30,则将,则将df n-1带带入,直到计算出的入,直到计算出的n为稳定数值为止。为稳定数值为止。2220.05224tssnLL例题例题1u某果园内果树的平均果实产量标准差某果园内果树的平均果实产量标准差s为为10 kg。若以。若以95的可靠性估计的可靠性估计果树产量,要求误差不超过果树产量,要求误差不超过2 kg,问,问应抽取多少果树做样本?应抽取多少果树做样本?222244 10100 2snL(棵)例题例题2u条件同例题条件同例题1,若
6、要求估计误差不超过,若要求估计误差不超过5 kg,问应抽取多少果树做样本?,问应抽取多少果树做样本?222222220.052222220.052244 1016 52.1311018 52.111018 5snLtsnLtsnL(棵)(棵)(棵)频率资料样本容量的确定频率资料样本容量的确定u对于以频率表示统计结果的资料,其样本对于以频率表示统计结果的资料,其样本容量的计算公式改变为:容量的计算公式改变为:u其中其中L的单位应与的单位应与p、q一致。一致。24pqnL例题例题3u某医生的按摩疗法预计对患者的治愈率为某医生的按摩疗法预计对患者的治愈率为75,若允许的误差为,若允许的误差为5,则应
7、调查多,则应调查多少位患者才能验证这一结论(少位患者才能验证这一结论(0.05)?)?2244 0.75 0.25300 0.05pqnL(位)成对资料和非成对资料样本容量的确定成对资料和非成对资料样本容量的确定u成对资料样本容量的确定成对资料样本容量的确定n对于成对资料中样本容量的计算,相应的公式为:n其中: 为试验所得各对间差异的方差; 为各对间差异平均数。222dt snd2dsd例题例题4u某药物试验以大鼠为对象,治疗前后大某药物试验以大鼠为对象,治疗前后大鼠体重差异标准差一般在鼠体重差异标准差一般在20 g左右。左右。若要使治疗前后对大鼠体重差异的估计若要使治疗前后对大鼠体重差异的估
8、计精确到精确到5 g,则需要多少只大鼠做试验,则需要多少只大鼠做试验(0.05) ?2220.05224 2064 5dtsnd(只)成对资料和非成对资料样本容量的确定成对资料和非成对资料样本容量的确定u非成对资料样本容量的确定非成对资料样本容量的确定n对于非成对试验,相应的公式为:n其中: 为试验各组间差异的方差 为各组平均数的差异值。n若计算所得n 16,则将df2(n-1)带入,直到计算出的n为稳定数值为止。22212(2)t snxx2s12xx例题例题5u某科学家对一定年龄女童的体重差异进行某科学家对一定年龄女童的体重差异进行了测量,结果显示其差异的标准差为了测量,结果显示其差异的标
9、准差为1.5 kg。若要使测量结果的误差为。若要使测量结果的误差为0.2 kg,则,则应对多少组女童进行调查?应对多少组女童进行调查?2220.05221228 1.5450()0.2tsnxx补充:两样本频率比较时样本容量的确定补充:两样本频率比较时样本容量的确定 两样本频率比较时,样本容量的计算公式两样本频率比较时,样本容量的计算公式为:为: 其中:其中: 为合并百分率;为合并百分率; 。 22228u pqpqnLLp(1)qp例题例题7u对两个食品厂进行抽查后,发现甲厂产品对两个食品厂进行抽查后,发现甲厂产品合格率为合格率为95,乙厂为,乙厂为91,若要推断,若要推断两厂间食品的合格率
10、是否确实相差两厂间食品的合格率是否确实相差4,取取=0.05时至少要检验多少批食品?时至少要检验多少批食品?20.950.910.9321 0.930.070.040.058 0.93 0.073260.04pqn 3抽样的基本方法抽样的基本方法u抽样调查是从总体中抽取一定数量的观察抽样调查是从总体中抽取一定数量的观察单位组成样本。其目的就是由样本指标来单位组成样本。其目的就是由样本指标来推断总体的特征。抽样方法正确与否,关推断总体的特征。抽样方法正确与否,关系到样本是否具有代表性,也直接影响到系到样本是否具有代表性,也直接影响到由样本所得估计值的准确性。由样本所得估计值的准确性。u根据研究情
11、况的不同,抽样方法可分为:根据研究情况的不同,抽样方法可分为:随机抽样、顺序抽样、典型抽样随机抽样、顺序抽样、典型抽样。随机抽样随机抽样u随机抽样要求在进行抽样的过程中,应该随机抽样要求在进行抽样的过程中,应该使总体内所有个体均有使总体内所有个体均有同等同等机会被抽取。机会被抽取。u由于抽样的随机性,可正确地估计试验误由于抽样的随机性,可正确地估计试验误差,从而得出科学合理的结论。差,从而得出科学合理的结论。u随机抽样可分为:简单随机抽样、分层随随机抽样可分为:简单随机抽样、分层随机抽样、整体抽样、双重抽样。机抽样、整体抽样、双重抽样。随机抽样随机抽样u简单随机抽样简单随机抽样n是最简单、最常
12、用的抽样方法,要求被抽总体内每一个体被抽的机会均等。即采用随机的方法直接从总体中抽出若干抽样单位构成样本。随机抽样随机抽样u简单随机抽样的方法简单随机抽样的方法n将总体内所有抽样单位全部编号,采用随机方法确定被抽单位编号,构成样本。随机抽样随机抽样u简单随机抽样的注意事项简单随机抽样的注意事项n简单随机抽样适用于个体间差异较小、所需抽取的样本单位数较小的情况。对于那些具有某种趋向或差异明显和点片式差异的总体不宜使用简单随机抽样。随机抽样随机抽样u分层随机抽样分层随机抽样n是一种混合抽样,特点在于将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区层按照一定的抽样分数(即一个样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 原理 方法
限制150内