田间试验15抽样调查.pptx
《田间试验15抽样调查.pptx》由会员分享,可在线阅读,更多相关《田间试验15抽样调查.pptx(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十五章 抽样调查 第一节 抽样调查方案 第二节 常用抽样方法的统计分析 第三节 样本容量的估计第一节 抽样调查方案n一、抽样单位n二、抽样方法n三、样本容量n四、确定抽样方案的一些因素一、抽样单位n抽样分数(sampling fraction):指一个样本所包含的抽样单位数占其总体单位数的成数。n田间抽样调查的抽样单位(sample unit)是随调查研究目的、作物种类、病虫害种类、生育时期、播种方法等因素而不同的,可以是一种自然的单位,也可以是若干个自然单位归并成的单位,还可以用人为确定的大小、范围或数量作为一个抽样单位。 n常用的抽样单位举例如下: n(1)面积 如0.5平方米或每平方米
2、内的产量、株数、害虫头数等。 n(2)长度 如12行若干长度内的产量、株数,若干长度内植株上的害虫头数等。 n(3)株穴 如棉花连续10株的结铃数,水稻连续20穴的苗数、分蘖数、结实粒数等。 n(4)器官 如稻、麦千粒重,大豆百粒重,每100个棉铃中红铃虫头数,每张叶片的病斑数等。n(5)时间 如单位时间内见到的虫子头数,每天开始开花的株数等。n(6)器械 如一捕虫网的虫数,一只诱蛾灯下的虫数,每一个显微镜视野内的细菌数、孢子数、花粉发芽粒数等。n(7)容量或重量 如每升或每公斤种子内的混杂种子数,每升或每公斤种子内的害虫头数等。n(8)其他 如一个田块、一个农场等概念性的单位。二、抽样方法n
3、基本的抽样方法(sampling method)有以下三类:n1顺序抽样(systematic sampling) 也称机械抽样或系统抽样,按照某种既定的顺序抽取一定数量的抽样单位组成样本。 n2典型抽样(typical sampling) 也称代表性抽样,按调查研究目的从总体内有意识地选取一定数n量有代表性的抽样单位,至少要求所选取的单位能代表总体的大多数。 n3随机抽样(random sampling) 也称等概率抽样,在抽取抽样单位时,总体内各单位应均有同等机会被抽取。 常用的顺序抽样方式 三、样本容量n样本容量(或样本含量sample size):指样本所包括的抽样单位数。样本容量的大
4、小与所获抽样调查结果的准确度和精确度密切有关。 四、确定抽样方案的一些因素n设计抽样方案时须考虑以下几方面:n(1) 所要求的准确度与精确度,要求高时样本容量应大。 n(2) 是否需估计置信限或作统计推论,一般随机抽样有合理的试验误差估计,可以做统计推论。而其他抽样方法往往缺乏合理的误差估计,统计分析有局限性。 n(3) 与人力、物力、时间等条件相适应,抽样单位大、样本容量大、进行总体编号等都是较费事的,必须权衡需要与可能,在保证一定精确性的情况下,尽量减低消耗。n(4) 注意到调查研究对象的特点。 第二节 常用抽样方法的统计分析n一、简单顺序抽样及简单典型抽样法n二、简单随机抽样法n三、分层
5、随机抽样法n四、整群抽样法n五、分级随机抽样法n六、双重随机抽样法n七、序贯抽样法一、简单顺序抽样及简单典型抽样法n简单顺序抽样(simple systematic sampling):通常只计算平均数作为总体的估计值。n计算平均数的公式为: nyy/n例15.1设成熟期对水稻汕优2号大田测产,该田块约5亩,生长较均匀。采用棋盘式抽样,10个点,每点由12行间距计算平均行距。其中任选二行测查2m长度内的穴数及有效穗数。再在其中拔连续5穴,将稻穗分成大、中、小三级,按比例选取20穗,结合考查其他性状计数每穗总粒数及空瘪粒数,从而算出结实粒数。每点其余稻穗脱粒,称取千粒重。将10点数据汇总后求得每
6、亩平均穴数4.2万,每穴平均n有效穗数9.2个,每穗平均结实粒数53.7粒,平均千粒重25.2克。计算平均数的公式为。本例中土地利用系数定为98%,则估计每亩产量为: = 513.75(kg/亩) n简单典型抽样法的分析同样只计算 。10001000土地利用系数千粒重每穗结实粒数每穴有效穗数每亩穴数100010009825.253.79.242000%nyy/二、简单随机抽样法n简单随机抽样(simple random sampling):每个抽样单位具有相同概率被抽入样本。总体编号方法及随机抽取方法依调查对象而定。n例15.2 设在一休闲地上调查小地蚕虫口密度每测框为1m2,随机取30点,调
7、查结果列在表15.1。 表15.1 30个单位的小地蚕幼虫头数 4.3630131ffyy2.63130/30(131)77312nnfyfys22)(0.48302.63/nssy/每m2内幼虫头数( y )0123456789101112 单位数(个)123844222100130 fy02624162012141690012131 fy20212726410072981288100144773(头/)(头/)(头/) n即该田块小地蚕幼虫约为3.385.34(头/),折合每亩2253.43560.2头,这个估计的可靠性为95%。n以上将所调查研究的总体看为面积甚大的一个无限总体进行分析,
8、设若该30个单位从336的一块田中抽出,这时调查研究的总体实为一有限总体,有限总体的两个参数为:n平均数 (151) 0.984.360.482.0454.36置信限为:95ystyL05. 0%NYY/(头/)n标准差nN 为总体内单位数,即总体容量。n样本估计值仍为及,但估计抽样误差时应考虑到抽样分数的影响。 1NYYNi2)()(1nssy(153)(152)n本例中 (头/)n该有限总体平均数的95%置信限为: (头/)即3.425.30(头/),折合每亩2280.03533.4头。0.46)33630(1302.63)(1nssy0.944.360.462.045.36954%05.
9、 0yYstyL三、分层随机抽样法n分层随机抽样法(stratified random sampling):从各个层次或段落分别进行随机抽样或顺序抽样。n分层随机抽样有三个步骤:n(1)将所调查的总体按变异情况分为相对同质的若干部分、地段等称为区层,各区层可以相等,也可以不等。 n(2)独立地从每一区层按所定样本容量进行随机抽样。各区层所抽单位数可以相同,也可以不同。 n抽样单位总数在各区层的分配有:n 比例配置法:指各区层大小不同时按区层在总体中的比例确定抽样单位数,若各区层大小相同,比例配置结果实际即为相等配置;n 最优配置法:指根据各区层的大小、变异程度以及抽取一个单位的费用综合权衡,确
10、定出抽样误差小、费用低的配置方案。 n(3)根据各区层的估计值,采用加权法估计总体参数。n总平均数 : (154) n 总标准误: iikkiiypypypypypy2211 n若各区层总体方差相同,则 2/122222222212121)(kkkiiiynspnspnspnsps)(iiinsp22)(2iiynpss(15)(156)n若各区层抽样单位数按区层比例配置,则 (157)n其中 iynss )()()()(2112.111iiiiikinjiijnsnnyysi(158)四、整群抽样法n整群随机抽样法( random group sampling ):被抽取的整群中各抽样单位都
11、进行调查,按群计算平均数及标准差,并估计其置信限。 n例15.4 设某农场调查水稻螟害发生情况,在全场100个条田中随机抽取9条做调查,每田块采用平行线式取10点,每点连续查20穴,经初步整理后将结果列于15.2。 某农场螟害率抽样调查结果田 块123456789调查茎秆数198020622154251223152098242118672248螟害茎秆数 178 211 335 345 212 238 460 119 298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25n这资料以条田为抽样单位进行分析。)11.96(13.25)/910.23(8.
12、99%nyy)3.85(1%/)(22nnyys)1.28(93.85%ys)2.95(11.961.282.30611.9695%05. 0ystyL819DFn全场100条田平均螟害率95%的可能在9.0114.91%范围内。n本例的总体实际上是一个N =100的有限总体,故更确切地应为:)1.22(1009193.851%nssy)2.81(11.961.222.30611.9695%05. 0yYstyL即9.1514.77(%)间。n此外,本例是百分数资料,如果田块间的差异不大,可以采用百分数资料的分析方法,即由总调查茎秆数和总螟害茎秆数求出总螟害率 ,得 n这样, 即11.6912
13、.59(%)。这个区间比前面所估小得多,这是因为前面以田块为抽样单位,而不是以)12.14(2396/19657%p%)(0.230.0023196570.1214)0.1214(11nppsp)0.45(12.140.231.9612.1495%pLn茎秆为单位,除了有茎秆受害与否的随机误差外,还包含有田块间的差异,所以此处不宜采用百分数的误差估计方法。五、分级随机抽样法n巢式随机抽样法(nested random sampling):最简单的是二级随机抽样。例如全区的棉花结铃数,可以在区内随机抽取几个乡,乡内随机抽取若干户进行调查。这时,乡为初级抽样单位,户为次级抽样单位。又例如研究农药在
14、叶面上的残留量,第一步随机抽取单株,第二步在单株上随机抽取叶片,分别作为初级和次数抽样单位。表15.3 某农药残留量分析结果及其方差分析 22BAn2A0.00662A0.072440.00660.29612B 植 株各叶片内的残留量(单位数)合计平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30变异来 源自由度均 方所估计的方差分量F植株间 3 MSB=0.2961* 44.9 F0.05(3,12)=3.49株内叶 片间12 MS
15、A=0.0066n巢式随机抽样数据可以应用方差分析法算出各阶段的抽样误差,从而估计平均数的标准误。二级抽样的公式如下: (1513)n其中,k=初级抽样单位数,n =次级抽样单位数。 (1514) n、分别为次级和初级抽样误差的估计值。 knyykn11knksBAy2222A2Bn二级抽样的数据按单向分组的组次数相等(也可能不相等)的随机模型进行方差分析。例题中k=4,n=4,方差分析结果F =0.2961/0.0066=44.9,说明植株间的误差显著大于株内叶片间的误差。n这二个阶段的抽样误差是不同的,应该分别估计。但此处若将kn=44=16张叶片直接计算其方差则为0.0645。比扣除株间
16、误差后剩余的株内叶片间误差0.0066大得多。n例15.5 表15.3数据的分析结果:3.16550.56/16 knyykn11(单位) 0.018506160.29611)(22222BABAynnkknks(单位)2 0.136ys(单位) 0.4333.1650.1363.1823.16595ystyL05. 0%(单位) 此处DF=3,因2ys由均方MSB计算。2ys 若只从1个初级单位估计置信限,如以株为单位作估 计,则:0.0740340.29614414)(22222BABBys (单位)2 0.272ys(单位) 0.8663.1080.2723.1823.10895ysty
17、L05. 0%(单位)由一株四张叶片估计,比四株16张叶片估计,误差 要大得多。若每株只取一张叶片,四株共取4张叶片,则0.019750.0724)(0.0066414144)(22222BABAys0.141ys(单位) 所以,同样测定4张叶片,从1株上取与从4株上取, 抽样误差是不同的,今后对此材料抽样测定时,应多取植株,每株上可以少取一些叶片。n三级抽样时的情况为:n 、 、 依次为三级、二级及一级抽样单位的抽样误差,分别抽取n、k、l个不同级别的抽样单位,则所获样本平均数的抽样误差为 n获得后,其总体平均数的置信区间的计算方法与前相同。2A2B2ClklnklsCBAy2222(151
18、5)六、双重随机抽样法n双重抽样法(double sampling):亦称相关抽样法。若所要调查的性状y是不易观察测定,甚至对观察材料要破坏后方能测定的,而试验又不容许将材料破坏,这时可以利用和所要调查的性状有密切相关关系的另一便于测定的性状x进行间接的抽样调查,按确定的相关关系从x的调查结果推算y 的结果。 n1.做一次随机抽样,调查y 和x两种性状,从中求出y 依x 的回归方程。这个样本容量 n 不一定很大,但希望x 和y 有较大的幅度。 bxay2或nyyssexy222/) (n2.对总体进行x的抽样调查,设样本容量为m,按以上建立的回归关系从 推算n 的标准误 的近似式: (1516
19、) xymxxxbayymsbssxyy2222msbnsxxy222/n采用双重抽样法,必须注意 y 和 x 两性状间不但要有显著相关,而且须有高程度显著相关,才能获得比较准确的结果,所以在建立回归方程时要检验其相关系数的大小及显著性。七、序贯抽样法n序贯抽样法( sequential sampling ):根据逐个抽样单位调查累积的信息,在抽样过程中当机确定样本容量。 n序贯抽样法的基本步骤:n(1) 确定作为“推断”所依据的两个标准,P0与P1,此处P0=0.50(即50%)、P1=0.75(即75%)分别代表不符控制要求(必须治虫)及符合控制要求(不必打药)的两个界限。n(2) 确定“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 15 抽样调查
限制150内