应用抽样技术课后习题答案.pdf
应用抽样技术答案第二章抽样技术基本概念2.7(1)抽样分布:3 3.67 4.33 5 5.67 6.33 71/10 1/10 2/10 2/10 2/10 1/10 1/10(2)期望为5,方差为4/3(3)抽样标准误1.155(4)抽样极限误差2.263(5)置信区间(3.407,7.933)第三章简单随机抽样3.3为调查某中学学生的每月购书支出水平,在全校名学生中,用不放回简单随机抽样的方法抽得一个的样本。对每个抽中的学生调查其上个月的购书 支 出 金 额力(如表1所 示)。在95%的置信度下估计该校学生该月平均购书支出额;(2)试估计该校学生该月购书支出超出70元的人数;(3)如果要求相对误差限不超过10%,以95%的置信度估计该校学生该月购书支出超出70元的人数比例,样本量至少应为多少。表1 3 0名学生某月购书支出金额的样本数据支 出额(元)样本序 号支出额(元)样本序 号支 出额(元)样本序 号11121231341451561671781812091910203.3解:(1)依据题意和表1的数据,有:z M =1682,7=56.07(%),s;=(118266-16822/30)/30=798.73匕0 竺-3。=0.03276后 Fn nxN 30 x1750v(y)=0.03276 x 798.73=26.168se(9)=7=5.115因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对 应 的t=L 9 6,所以,可以以95%的把握说该学生该月的人均购书支出额大约在56.071.96X5.115,即50.9661.19元之间。(2)易知,N=1750,n=3 0,丐=8 t=1.96P=nQ=0.2 6 73 0pq=0(1 -p)=0.2 6 7 x 0.7 3 3 =0.1 9 5 7。二=j0.03389x0.1957=0.08144n =0.01672 nP的9 5%的置信区间为:P(,(a1 2 J)P q+)=0.2 6 7 (1.9 6 x 0.0 8 1 4 4 +0.0 1 6 7)n-2n=(0.0 9 0 7,0.4 4 3 3)M的9 5%的置信区间为:(1 5 9,7 7 6)(3)N=1 7 5 0,n=3 0,n 1 8,t=l.9 6,p=0.2 6 7,q=l-O.2 6 7=0.7 3 3由此可计算得:t2q I%?x0.733n()=-=1054.64 r2p 0.01x0.267n=n0/1+(n01 )/N=1054.64/1+1053.64/1750=658.2942=659计算结果说明,至少应抽取一个样本量为6 5 9 的简单随机样本,才能满足9 5%置信度条件下相对误差不超过1 0%的精度要求。3.5要调查甲乙两种疾病的发病率,从历史资料得知,甲种疾病的发病率为8%,乙种疾病的发病率为5%,求:(1)要得到相同的标准差0.05,采用简单随机抽样各需要多大的样本量?(2)要得到相同的变异系数0.05,又各需要多大的样本量?3.5 解:已知 P l=0.0 8,Q l=1-P 1 =0.9 2;P2=0.05,Q2=1-P2=0.95;V(p)=0.05*0.05由PQ/乐得:1几。-0.0-8x0、.92=“300.052)0.05x0.95 s/=-5=19 0.052(2)由。二昔QW得:)Cv (p)Pi=-0z.-9-2-=4761c0 00.052 X0.08肃镰二76 00第四章分层抽样4.3解:(1)兀=2 0。7(元),s(叉,)=3.0 8(元)(2)按比例分配 1 8 6,%=5 7,%=9 2,(3)Neyman分配 n=175,1=33,n2=99,4.5歹“=7 5.7 9(元方置信区间(60.63,1 1 3=3 7n3=4390.95)元。4.6 解 已知W=0.2,W2=0.3,W3=0.5,P=0.1,P2=0.2,P3=0.4P=ZhWhPh=0.28,Q=1P=0.72n=100的简单随机抽样估计方差:V(Psrs)h(1f)/100PQ=0.28*0.72/100=0.002016按比例分配的分层抽样的估计方差:V(Pprop)=hWh2(1-fh)/nh Ph Qh*n-1ZhWh Ph Qh=n1 0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6=0.186 n1故 n-92.26-934.8 解 已知W 二0.7,W2=0.3,p1=1/43,p2=2/57(1)简单随机抽样Psrs=(1+2)/100=0.03V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937(2)事后分层Ppst=ZhWhph=0.7*1/43+0.3*2/57=0.0268V(Ppst)=ZhWh2(1-fh)/(nh-1)phqh=0.72*1/42(1/43)(42/43)+0.32*1/56(2/57)(55/57)=0.00031942第五章比率估计与回归估计5.2 N=2000,n=36,1-Q=0.95,t=l.96,Af =n/N=0.018,v(R)=0.000015359,人se(R)=0.00392置信区间为 40.93%,42.47%。第五章比率估计与Hl归估计c C5.3当月 黑寸用第一种方法,当夕 中寸用第二种ZCr 乙 Jy方法,当月=0寸两种方法都可使用。这是因为:_ n nv(e)=v(力)=U 序(仁+废 一 ip cYcx)X Y l 若夕 则 v)-v()=R2cxapcy-cx)m V(X)-V()=R2CX(ZpCY-Cx)0“y X X n5.4 解:V(YR(10/nY2CY2+Cx22rCYCxV(Ysrs)=(lf)/nSY2=(1f)/n CY2Y2故V(YR)A(Ysrs)=l-tlrC x/C vCX2/CY2=l-2*0.696*1.054/1.063-1.0542/1.0632=1-0.397076=0.6029245.5 证明:由(5.6)得:N(工 一 附 了5公 二 工;n N l Nn令Nn则 (NV+S;)=NS;,S2从而/=NS;N S j i+豆NV5.6解简单估计:总产量:AKrs=(N/n)m=(140/10)1400+1120+.+480=176400(斤)Av(Ysrs)=N2(lf)/nSY2=1402(l10/140)/10*194911.1=354738222Ase(Ysrs)=18834.4965.6 解(2)比率估计:R=Zi=J Y/Zi=J x.=12600/29.7=424.2424YR=XR=460*424.2424=195151.5(斤)v(YR)=N2(lf)/n(xRX)2/(n-l)=1402(l10/140)/90*124363.5=25149054se(Ysrs)=5014.883面积/rr jPH产量/Jr314002.511204.217103.615001.87205.219803.213102.410802.613001.248029.7126005.6解回归估计:回归系数 b=Sxy/Sxx2=370.5965Jylr=Xb(xX)=1260370.5965*(2.97460/140)=1377,089Ylr=Nylr=192792.47(Jf)v(Ylr)=N2(lf)/n*Si=in Y iyb(Xix)2/(n-2)=1402(I_10/140)/80*89480.59=20356834se(Ylr)=451L8555.7解:E(凡.)=匕 丫()=5;(1-夕2)一 一 1 工 _H.=+3(X M)=y +2 3(X B=工 以 一2 3(七 一 乂)*一 一 仁E(y;r)=E(ylr)+BX-E(x)=Y1 _ 1 _ f 1 N _ _v(工)二 V -氏-23(七-幻 =7 1石1-28(Xj-1 2几 i=,_,二(S;+4B2S-4 5 5 )+4B(BS;-)n n=乜3注-s;(l-p 2)=V(%)n n故估计量论虽然与歹丁样都是F的无偏估计,但方差不小于巩的方差,当夕W 0 时 V(用)V(,,故升不优于沙第六章不等概率抽样6.1假设对某个总体,事先给定每个单位的与规模成比例的比值乙,如下表,试用代码法抽出一个n=3的PPS样本。表 工总体单位规模比值1Nz10.09860.06720.10270.04830.05780.15440.25190.2236.1解:令%=1 0 0 0,则可以得到下表,从11000中产生n=3个随机数,设为108,597,7 5 4,则第二、第六和第七个单位入样。1叫1982102357425156764871548223Mo=1OOO累计M代码9819820099200257201-257508258 508575509 575623576-623777627 7771000778-10006.3欲估计某大型企业年度总利润,已知该企业有8个子公司,下表是各子公司上年利润%.和当年利润匕的数据,以M 作为单位X 大小的度量,对子公司进行P P S 抽样,设n=3,试与简单随机抽样作精度比较。表2 某企业各子公司上年与当年利润(单位:万元)子公司序号X 子公司序号X 匕J1L1 2381 353521528127466396798954351265079201 085459460881 8341 6298 86.3N=87=3,X=ZX,=6857,工匕=7199z=l i=l对子公司进行抽样,根据教材(6.7)式:v(-“)=1 EN Z,(十Y 一 丫 广9n z=i Zz1N 丫2 J=xz,y 2n i=X jIP=-6 8 5 7 x 7 7 0 7.8 2-7 1 9 923L=342303.5Jf)=585.07简 单 碧 司 进 行 简 单 随 机 抽 样,同样样本量防的8x5=x 4580379.69=61071729.2 v (E?s)=7814.84P尸 S抽样的设计效应是:忏 _ 342303.5一 61071729.2=0 0 0 5 6 0 5显然对PPS抽样,估计量的精度有显著的提高。6.4解(1)PPS的样本抽样方法可采用代码法或拉希里法.(2)若在时间长度2、8、1、7h中打入电话数量分别为8、29、5、2 8,则客户打入电话的总数:YH H=(35/4)8/2+29/8+5/1+28/7=145.46875(3)估计量的方差估计v(YHH)=n(n-1)-iZl=1n(y i/Zi-YHH)2=352/(4*3)(8/24.15625)2+(29/84.15625)2+(5/14.15625产+(28/74.15625)2=106,46976.5设总体N=3,ZF1/2,1/3,1/6,匕=10,8,5,采取的n=2的nPS抽样,求叫,丐(/,/=1,2,3)o1 0),(D 所有可能样本为:(1 0,8),(8,5),(5,1 0),(5,8)(1 0,5),(8,其概率分别为:1x2 =一22 3 61 1 1 x-=一2 3 61 1 1x =3 4 1 21 3-X 6 53301 3 3 X -3 4 121 2 2x=6 5 30所以:_2_ I-1-1-3-1-3-516 6 12 30 602 1 3 2 44|1-1 3一 6 12 12 30-6 01 1 3 2 25=-1-1-1-=-3 6 12 30 30 602 3 35兀 =I-=6 12 601 3 16 13=一+-1 6 30 601 2 9兀=-+-二-12 30 606.6解(1)简单随机抽样简单估计Y=2+3+6+8+11+14=44S2=(N-1)-?=N(YLY)2二(2*322)2+(3*322)2+(6*322)2+(8*322)2+(11*322)2+(14*322)2/(5*9)=322/15=21.4667总值估计的方差估计V(Ysrs)=N2(1f)/nS2=36(12/6)/2322/15=1288/5=257.66.6解(2)简单随机抽样比率估计X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,R=44/36=11/9,f=2/6=1/3总值估计的方差估计V(YR)=N2(1-f)/n Zi=1N(Yi-R Xi)2/(N-1)=36(1 2/6)/10(2 1*11/9)2+(32*11/9)2+(64*11/9)2+(87*11/9)2+(11 9*11/9)2+(14 13*11/9)2=(12/5)*(488/81)=1 4.466.6解(3)PPS抽样汉森赫维茨估计X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,取Zj=X/X,(i=1,2,6)总值估计的方差估计V(YHH)=(1/n)Zi=1NZi(Yi/Zi-Y)2=(1/nX)立 尸 为/%丫)2=(1/72)1*(36*2/1 44)2+2*(36*3/244)2+4*(36*6/444)2+7*(36*8/744)2+9*(36*11 /944/+13*(36*14/1 44)2=24.96第七章整群抽样 7.1 (略)7.3解e 2不是 2的无偏估计,此因类似于 2 =4/T)S:+(A -D S;有一一(M二1反土叱1)日因为对群进行简单随机抽样,故aM-1Esj=S;,Esl=S:,从而 ES2=aM-1W S 2 ,若取6 2 _ A(Ml)s:+(A l)s;一AM 1贝1 J E2=S?7.2样本耐用时数1 1036 1075 1125995 1088 1065 1023988 10029942 1047 1126 1183 1058 1142 1098945968 10369873 1046 1153 1087984 1224998 1032976 11039584 1153 1078 1039 1006 1214 1076986994 104811265 1216 1094 1096 1035 1004 1053 1004 1122 108011526964 1136 1185 1021 1007948 1024975 10839947 1113 1093 1005 1088997 1034985997 100511208 1047 1097 1136989 1073 1102976984 10041082耐用时数均值标准差11036107511259951088 1065 10239881002994 1039.1 47.09907210471126118310581142 109894596810369871059 78.4644331046115310879841224998 10329761103958 1056.1 85.65493411531078103910061214 10769869941048 1126107273.9324512161094109610351004 1053 1004 11221080 1152 1085.666.573669641136118510211007948 10249751083994 1033.7 77.4453971113109310051088997 10349859971005 1120 1043.7 53.6595281047109711369891073 11029769841004 10821049 57.28098(1)以每盒灯泡为群实施整群抽样y=(1/80)Zij yij=1054.78,sb2=(10/7)4(Yiyj2=3017.65V(y)=(1f)/(aM)sb2=(18/2000)/(8*10)*3017.65=37,5697Se(y)=6.1294(2)以从20000个灯泡中按简单随机抽样,=(1/80)。加 =1054.78,s2=(1/79再(打一堀2=4628.667V(7)=(1f)/(aM)s2=(180/20000)/(8*10)*4628.667=57.6269Se(y)=7.59127.4对7.2题群内相关系数进行估计V=(1/80)。Yjj=1054.7Sw2=(1/a)ZiS(2=S/H M-ID lS S if-y J2=4721.0056r=(sb2-sw2)/sb2+(M-1)sw2=-0.04723Deff=V(y)/V(y)=1+(M1)r=0.66947.5解:由于农户是调查单位,故以村为抽样单位的抽样是整群抽样,村即是群。对于村既有生猪存栏数,也有户数,因此在村大小不等的整群抽样下,既可使用简单估计量估计生猪存栏数,也可以户数为辅助指标构造比率估计和回归估计来估计生猪存栏数。(1)简单估计量人3 2 4 0y =Ay =2 0 0 x /一=1 0 8 0 0,i出二a a-1=639424000,se(Y)=25287(2)以户数为辅助变量的比率估计量aK =1 0 0 0 0 0 x i5=1 1 3 6 8 4,s =3 1 4.4 5 2,2=9 8 8 8 0,f r nz 2心u s =3 6 5.7 1 8,2=1 3 3 7 5 0八 Zu y 3 2 4 0/?=Jr=1,1 3 6 8 4 f=0.9 3 4ZoDUzI7se&R)=G)=(5;+铲s;-2 R rsysx)=1 3 3 4 1 (3)以户数为辅助变量的回归估计量b=-5-2 2Sy 人 人X=0-8 0 3 而=4 7 5八 八 -八丫 卜=叫.=Y+b(NM 瓯=Y+b(M=108000+0.803X(100000-200X475)=112015se(,)=J v(Xr)=L )土 点;(1 ,)=9 0 3 4v a a-2显然以户数为辅助变量构造回归估计量效果最好。此因各村生猪存栏数与村的规模(户数)有高度相关性,r=0.9 3 4,故采用回归估计量精度最高。7.6企业已婚女职工人数/人Mi平均理想婚龄/岁女149524.12102022.8384425.54151824.6563525.8639423.77234624.57.6(1)按简单随机抽样抽取,简单估计量估计y=(1/7)Zj Mjy=25321.1571M=35680/35=1019.4286AY=y/M =24.8386v(y)=(1-f)/(a(a-1)M2)&y-y p=(1 7/35)/(42*1019.428621711911436=31.3768Se(y)=5.60157.6(2)按简单随机抽样抽取,采用比率估计量估计%=y”Mi=177248.1/7252=24.4413v(y)=(1f)/(a(a1)m2)Z,(y-Yrrij)2=(1 7/35)/(42*1019.42862)*4536349.45=0.0831445Se(7)=0.28837.6(3)按PPS抽样抽取,抽样概率与企业女职工人数成比例AYHH =y7/a=24.4286A _v(Y)=1/(a(a-1)V(户用=(1/42)*6.3542857=0.15129Ase(Y)=0.38896 7.7证明分别以P”,P srs记整群抽样简单随机抽样的估计量:V(P“)=dAf(P-P)2i二ly(P s r s)=1faM aM A M-deff=V(p.)AM-1AE(-n2/=1V(Ps)A T AP。一 加 一 上1 a A M-1A AAME 唯(i)2出 _A APQ APQ7.8市县编号社会从业人员数/万人mi第三产业从业人员数/万人ti1837.607.003241.307.394334.406.306528.904.978757.6011.237.8pR=I,tj/Zj irij=36.89/199.8=0.1846,v(PR)=(1f)/(a(a1)m2)Z,(t,pRmj)2=(1 5/110)/(20*39.962)*0.549388=0.00001642se(pR)=0.004052