《抽样技术》第四版题答案.pdf
《《抽样技术》第四版题答案.pdf》由会员分享,可在线阅读,更多相关《《抽样技术》第四版题答案.pdf(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 2.1 解:1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为 1 64 的这些单元中每一个单元被抽到的概率都是 2 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为 1 2 35以及编号为 64 的这 36 个单元中每个单元的入样概率都是,而尚未被 100 抽中的编号为 1 36 63 的每个单元的入样概率都是。100 3 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为 20 000 21 000 中的每个单元的入样概率都是,所以这种抽样是等概率的。1000 2.2解:项目 相同之处 不同之处 定义 都是根 据从
2、一个总 体 中抽样得到的样本,然 后定义样本均值为 y_ 1 n y。y yi。n i 1 抽样理论中样本是从有限总体中按放回的抽样方法得 到的,样本中的样本点不会重复;而数理统计中的样本 是从无限总体中利用有放回的抽样方法得到的,样本点 有可能是重复的。性质(1)样本均值的期望都 等于总体均值,也 就是抽样理论和数 理统计中的样本均 值都是无偏估计。(2)不论总体原来是何 种分布,在样本量 足够大的条件下,样本均值近似服从 正态分布。(1)抽样理论中,各个样本之间是不独立的;而数理统 计中的各个样本之间是相互独立的。(2)抽 样 理 论 中 的 样 本 均 值 的 方 差 为 1 f 2 2
3、 1 _ 2 V y S2,其中 S2 Yi Y。n N 1 在数理统计中,V y 1 2,其中 2 为总体的 n 方差。2.3 解:首先估计该市居民日用电量的 95%的置信区间。根据中心极限定理可知,在大 y Y y E y _ 样本的条件下,近似服从标准正态分布,Y 的 1 95%的置信区 V y V y 间为 y z 2 V y,y z 2 V y y 1.96 V y,y 1.96 V y。1 100 1 f 2 2 2 而V y S2中总体的方差S2是未知的,用样本方差 s2来代替,置 信区间 n 为 y 1.96 1nf s,y 1.96 1nf s 由题意知道,y 9.5,s2
4、206,而且样本量为 n 300,N 50 000,代入可以求得 v(y)1 f s2 1 300 50000 206 0.682 5。将它们代入上面的式子可得该市居民 n 300 日用电量的 95%置信区间为 7.880 8,11.119 2。根据置信区间的求解方法可知 把y 9.5,s2 206,r 10%,N 50 000代入上式可得,n 861.75 862。所以样 本量至少为 862。2.4 解:总体中参加培训班的比例为 P,那么这次简单随机抽样得到的 P 的估计值 p 1 f N p P 的方差 V p P 1 P,利用中心极限定理可得 在大样本的条件下近 n N 1 V p 似服
5、从标准正态分布。在本题中,样本量足够大,从而可得 P 的 1 95%的置信区间为 p z 2 V p,p z 2 V p。而 这 里 的 V p 是 未 知 的,我 们 使 用 它 的 估 计 值 根据正态分布的分位数可以知道 Z 2 1,所以 V y Vy _2 rY z2 也就是 1n 下一步计算样本量。绝对误差限 d 和相对误差限 r 的关系为 d rY。1 f 5 V p v p p 1 p 9.652 10 5。所以总体比例 P 的1 95%的置信区间 可以写为 p z 2 v p,p z 2 v p,将 p 0.35,n 200,N 10 000 代入可得置 信区间为 0.284
6、4,0.415 6。2.5 解:利用得到的样本,计算得到样本均值为 y 2 890/20 144.5,从而估计小 区 的 平 均 文 化 支 出 为 144.5 元。总 体 均 值 Y 的 1 95%的 置 信 区 间 为 y z 2 V y,y z 2 V y,用 v y 1nf s2来估计样本均值的方差 V y。2 1 f 2 1 0.1 计 算 得 到 s2 826.025 6,则 v y s2 8 2 6.0 2 5 6,3 7.1 7 2 n 20 z 2 V y 1.96 37.172 11.95,代入数值后计算可得总体均值的 95%的置信区间为 132.55,156.45。2.6
7、 解:根据样本信息估计可得每个乡的平均产量为 _ 产量 Y 的估计值为 Y 350 y 350 1120 3.92 105(吨)。Y N 1 f S2,总体总值的 1 95%的置信区间 n n0 61.3 62。如果考虑到有效回答率的问题,在有效回答率为 70%时,样本量应该最终确定为 n n0 70%88.57 89。2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关 系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估 计今年的化肥总产量。去年化肥总产量为 X 213 5。利用去年的化肥总产量,今年的化肥1 120 吨,该地区今年的粮
8、食总 VY 总体总值估计值的方差为 ,把 Y 3.92 105,S2 25 600,n 50,N 350,f Nn,z 2 1.96 代 入,377 629,406 371。可 得 粮 食 总 产 量 的 1 95%的 置 间为 2.7 解:首 先 计 算 简 单 随 机 抽 样 条 件 下 所 需 要 的 样,把 N 1 000,d 2,1 95%,S2 68 带 入 公 式 n0 1 1 d2 N z2/2S2 最后 可得 Y z 2 VY V Y,Y z 2 总产量的估计值为 YR RX y_ X 2 426.14吨。x 1f2 2.9 解:本题中,简单估计量的方差的估计值为 v y s
9、2=37.17。n 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为 X。文化 支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之 间的关系是比较稳定的,且全部家庭的总支出是已知的量。_ _ _ 文化支出的比率估计量为 yR RX y_ X,通过计算得到 y 2 890/20 144.5,而 x _ y 144.5 _ x 1580,则 R _ 0.0915,文化支出的比率估计量的值为 yR 146.3(元)。,则 x_ 1580,文化支出的比率估计量的值为 R(元)。现在考虑比率估计量的方差,在样本量较大的条件下,1 f 2 2 2 V yR
10、MSE yR S2 2R S Sx R2Sx2,通过计算可以得到两个变量的样 n 2 2 4 本方差为 s2 826,sx2 9.958 140,Y和X 之间的相关系数的估计值为 0.974,比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的 把具体的数值代入可得置信区间为 143.57,149.03。_ V yR v yR R R 1.94 V y v y 37.17 计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。2.10 解:利用简单估计量可得 y yi n 1 630/10 163,样本方差为 s2 212.222,1 f 2 1 10/120 N 120,样本均
11、值的方差估计值为 v y s2 212.222 19.453 7。n 10 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是 合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相 关性,相关系数的估计值为 0.971,而且这种相关关系是稳定的,这里肉牛的原重量的 数值已经得到,所以选择肉牛的原重量为辅助变量。回归估计量的精度最高的回归系数 的估计值为 s 0.971 14.568 1.368。sx 10.341代入上面的公式,可以得到比率估计量的方差的估计值为 v yR 1.94。这个数值 信区间为 yR z 2 v yR,yR z 2
12、v yR yR 1.96 v yR,yR 1.96 v yR 1 95%的置 接下来比较比估计和简单估计的效率,0.052,这是比估 ylr 159.44。有 v ylr v y。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量 的精度要好于简单估计量。第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中 最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之 间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对 几种分层方法的判断如下:(1)选择性别作为分层变量,是不合适的。首先,性别这个变
13、量与研究最关心的变量(不 同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量 后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的 职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性 的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查 研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革 的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选 取出来的样本具有很好的代表性。(
14、3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要求。所以,按照职称进行分层是合理的。(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机 抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这 样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单 随机抽样更加方便实施。3.2 解:设计的方案如下:第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证 每个新生的入样概率相等,因为每个专业
15、的人数比例未知,8 个人的样本量无法在每个层之现在可以得到肉牛现重量的回归估计量为 ylr y X x,代入数值可以得到 回归估计量 1f n 2 s2 1,代入相应的数值,1f2 s n 2 1 1.112,显然 ylr 的方差为 V MSE ylr S2 1 2,方差的估计值为 间进行分配。所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专 业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出 这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出 8 个人。这样就可以 保证每个人入选的概率是相等的。第二种方案:也可以按照性别进行分类,
16、对他们进行编号,为 1800,使得男生的编 号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所对应的 性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出 8个新生。这样就可以保 证所有的新生的入样概率是相同的。第三种方案:随机地把所有的人分成 8 组,而且使得每组的人都是 100 个人,这样分组 完成后,每个组的新生进行编号为 1 100,然 后随 机 抽 取 出 一 个 号 码,再 从 所 有 的 小 组 中 抽取出号码所对应的新生,从而抽取出 8 个人。3.3 解:(1)首先计算出每层的简单估计量,分别为 y1 11.2,y2 25.5,y3 20,其 中,
17、N1 256,N2 420,N3 168,N 844,则每个层的层权分别为;W1 N1 0.303 3,W2 N2 0.497 6,W3 N3 0.1991 NNN 则利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量 值可以得到 yst Wh yh 20.07。_ 3 1 f 购买彩票的平均支出的的估计值的方差为 V yst Wh21 fh Sh2,此方差的估计值 h 1 nh 3 2 1 f 2 21 fh sh2,根据数据计算可以得到每层的样本方差分别为:nh 2 2 2 s12 94.4,s22 302.5,s12 355.556 (2)由区间估计可知相对误差限满足 yst Wh
18、 yh,代入数 为 v yst Wh2 h1 其中 n1 n2 n3 10,代入数值可以求得方差的估计值为 v yst 9.473 1,则估计的标 _ P yst Y rY 1 yst Y P V yst V yst rY rY 1 rY 所以 VrYyst z 2,V yst _2 rY z2 准差为 s yst v yst 9.473 1 3.08。的分配情况如下:n1 33,n2 87,n3 186 n1 n2 66。3.4 解:(1)首 先 计 算 得 到 每 层 中 在 家 吃 年 夜 饭 的 样 本 比 例 为 p1 0.9,p2 0.933 3,p3 0.9,p4 0.866 7
19、,p5 0.933 3,p6 0.966 7,那么根据每 层的层权,计算得到该市居民在家吃年夜饭的样本比例为 层中在家吃年夜饭 的样本比例的方差为 V ph 1 fh Nh Ph 1 Ph Nh nh,则该市居民在家吃年夜饭的比例 nh Nh 1 Nh 1 nh 样本均值的方差为 V yst Wh2 1 h1 nh h Sh2 1n WhhSh N1 WhSh2,从而可以得 到 在 置 信 度 为,相 对 误 差 限 为 2 2 2 2 Wh2Sh2 h Wh2Sh2 h。12 WhSh N r 条 件 下 的 样 本 量 为 n 12 V yst 1 WhSh2 st N h h 对于比例分
20、配而言,有 Wh h 成立,那么 n WhSh2 _ 2 1 2 rY z 2 WhSh2 N,把相应 2 的估计值和数值 1 95%,r 10%代入后可以计算得到样本量为 n 186,相应的在各 层的样本量分别为 n1 56.4 57,n2 92.6 93,n3 186 n1 n2 36。按照内曼分配时,样本量在各层的分配满足 h WhSh WhSh,这时样本量的计 算公式变为 2 WhSh,_ 2 1 2,rY Z 2 N1 WhSh2 把相应的数值代入后可得 n 175,在各层中 6 pst Wh ph 92.4%。h1 的方差,在 Nh 1 Nh 的条件下,V pst Wh2V ph
21、N12 h 1 N h 1 2 Nh2 Nh nh Nh 1 Ph 1 Ph nh 6 Wh2 1 fh h1 Ph 1 Ph nh 而其中每层的吃年夜饭的样本比例的方差的估计 值为 v ph 1 fh nh nh nh 1 ph 1 ph Nh nh ph 1 ph Nh nh 1 则样本比例的方差的估计值 r 为 v pst Wh2v ph Wh2 1 fh ph 1 ph,把相应的数值代入计算可得方差的 h 1 h 1 nh 1 估计值为 v pst 3.9601 10 4,从而可以得到该估计值的标准差为 s pst 0.019 9。(2)利用上题的结果,n h h h h h h,这里
22、的方 1 2 2 1 2 V pst N WhSh2 rP Z 2 N WhSh2 差是 Sh2 Nh Ph 1 Ph,在 Nh 1 Nh 的条件下,近似有 Sh2 Ph 1 Ph。Nh 1 W S2 比例分配的条件下,有 Wh h 成立,那么 n h h,把相应的 2 1 2 rP z 2 1 WhSh2 N Wh2Sh2 h Wh2Sh2 h 估计值和数值代入可以求得最终的样本量应该是 n 266 3,样 本 量 在 各 层 的 分 配 是 n1 479.34 4 7n92,559.23 n53 59,3 7 2.,8 3n4 327339.67 240,n5 426.08 426,n6
23、585.86 586。内曼分配条件下,h WhSh WhSh,则 n 2 WhSh,代入相 2 1 2 rP Z 2 WhSh2 N 应 的 估 计 值 和 数 值 可 以 计 算 得 到 样 本 量 为 n 256 5,在 各 层 中 样 本 量 的 分 配 为 n1 536,n2 520,n3 417,n4 304,n5 396,n6 392。3.5 解:总体总共分为 10 个层,每个层中的样本均值已经知道,层权也得到,从而可 以计算得到该开发区居民购买冷冻食品的平均支出的估计值为 10 yst Whyh 75.79。h1 下一步计算平均支出的 95%的置信区间,首先计算购买冷冻食品的平均
24、支出的估计值的 方差,其中 V _ 10 2 yst Wh 1 f 2 h Sh2,但是每层的方差是未知,则样本平均支出的方差的 nh 估计值为 v _ 10 1 f yst Wh2 1 fh sh2,每个层的样本标准差已知,题目中已经注明各层的抽 h 1 nh 样比可以忽略,计算可以得到 v _ 10 1 yst Wh2 1 h1 h sh2 59.825 4。则这个开发区的居民 nh 代入数值后,可得最终的置信区间为 60.63,90,95。3.6 解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到 3 总体的比例为 P WhPh 0.28,则样本量为 100 的简单随
25、机样本的样本比例的方差为 h1 1 f 2 1 2 2 N V p S2,不考虑有限总体校正系数,V p S2,其中 S2 P 1 P,n n N 1 在 N 1 N 的条件下,通过简单随机抽样得到的样本比例的方差为 1 f 2 1 3 V p S2 P 1 P 2.016 10 3 nn 2 1 f 2 通过分层抽样得到的样本比例的方差为 V pst Wh2 h Sh2,但是因为不考虑有 nh 限总体校正系数,而且抽样方式是比例抽样,所以有 Nh Wh h nh 成立,样本比例的 Nn 2 WhSh 1 WhSh。对于每一层,分别有 Sh Nh Ph 1 Ph,nn 在 Nh 1 Nh 的条
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样技术 抽样 技术 第四 答案
限制150内