2023年《抽样技术》第四版习题超详细解析答案.pdf
《2023年《抽样技术》第四版习题超详细解析答案.pdf》由会员分享,可在线阅读,更多相关《2023年《抽样技术》第四版习题超详细解析答案.pdf(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、优秀学习资料 欢迎下载 第 2 章 2.1 解:1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为 164 的这些单元中每一个单元被抽到的概率都是1100。2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为 135 以及编号为 64 的这 36 个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为 3663 的每个单元的入样概率都是1100。3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为 20 00021 000 中的每个单元的入样概率都是11 000,所以这种抽样是等概率的。2.2解:项目 相同之处 不同之处 定义
2、 都是根据从一个总体中抽样得到的样本,然后 定 义 样 本 均 值 为_11niiyyn。抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。性质(1)样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。(2)不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。(1)抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。(2)抽 样 理 论 中 的 样 本 均 值 的 方 差 为21fV ySn,其中2_211iSYY
3、N。在数理统计中,21V yn,其中2为总体的方差。2.3 解:首先估计该市居民日用电量的 95%的置信区间。根据中心极限定理可知,在大样本的条件下,_yE yyYV yV y近似服从标准正态分布,_Y的195%的置信区间为22,1.96,1.96yzV yyzV yyV yyV y 。优秀学习资料 欢迎下载 而21fV ySn中总体的方差2S是未知的,用样本方差2s来代替,置信区间为111.96,1.96ffys ysnn。由题意知道,_29.5,206ys,而且样本量为300,50 000nN,代入可以求得 _211 300 50 000()2060.682 5300fv ysn。将它们代
4、入上面的式子可得该市居民日用电量的 95%置信区间为7.880 8,11.119 2。下一步计算样本量。绝对误差限d和相对误差限r的关系为_drY。根据置信区间的求解方法可知 _11yYr YPyYr YPVyVy 根据正态分布的分位数可以知道_21y YPZV y,所以2_2rYV yz。也就是2_2_222/221111rYrYSnNzSnNz。把_29.5,206,10%,50 000ysrN代入上式可得,861.75862n。所以样本量至少为 862。2.4 解:总体中参加培训班的比例为P,那么这次简单随机抽样得到的P的估计值p的方差 111fNV pPPnN,利用中心极限定理可得pP
5、V p在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得P的195%的置信区间为22,pzV ppzV p。而这里的V p是未知的,我们使用它的估计值以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 5119.652 101fV pv pppn。所以总体比例P的195%的置信区间可以写为22,pzv ppzv p,将0.35,200,10 000pnN代入可得置信区间为0.284 4,0.415 6。2.5 解:利用
6、得到的样本,计算得到样本均值为2 890/20144.5y,从而估计小区 的 平 均 文 化 支 出 为144.5元。总 体 均 值_Y的195%的 置 信 区 间 为22,yzV yyzV y,用21fv ysn来估计样本均值的方差V y。计 算 得 到2826.025 6s,则2110.18 2 6.0 2 5 63 7.1 7 220fv ysn,21.9637.17211.95zV y,代入数值后计算可得总体均值的 95%的置信区间为132.55,156.45。2.6 解:根据样本信息估计可得每个乡的平均产量为 1 120 吨,该地区今年的粮食总产量Y的估计值为_5350350 112
7、03.92 10Yy(吨)。总体总值估计值的方差为 221NfV YSn ,总体总值的195%的置信区间为22,YzV YYzV Y ,把523.92 10,25 600,50,350,YSnN 2,1.96nfzN代 入,可 得 粮 食 总 产 量 的195%的 置 信 区 间 为377 629,406 371。2.7 解:首 先 计 算 简 单 随 机 抽 样 条 件 下 所 需 要 的 样 本 量,把21 000,2,195%,68NdS 带 入 公 式2022/211dnNzS,最 后 可 得061.362n。如果考虑到有效回答率的问题,在有效回答率为 70%时,样本量应该最终确定为0
8、70%88.5789nn。2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为213 5X。利用去年的化肥总产量,今年的化肥以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 总产量的估计值为_2 426.14RyYRXXx吨。2.9 解:本题中,简单估计量的方差的估计值为21fv ysn=37.1
9、7。利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。文化支出的比率估计量为_RyyRXXx,通过计算得到2 890/20144.5y,而_1580 x,则_144.50.09151580yRx,文化支出的比率估计量的值为_146.3Ry(元)。现 在 考 虑 比 率 估 计 量 的 方 差,在 样 本 量 较 大 的 条 件 下,22212RRxxfV yMSE ySR S SR Sn,通过计算可以得到两个变量的样本方差为224826,9
10、.95810 xss,YX和之间的相关系数的估计值为0.974,代入上面的公式,可以得到比率估计量的方差的估计值为_1.94Rv y 。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的195%的置信区间为22,1.96,1.96RRRRRRRRyzv yyzv yyv yyv y ,把具体的数值代入可得置信区间为143.57,149.03。接下来比较比估计和简单估计的效率,_1.940.05237.17RRVyv yV yv y ,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。2.10 解:利用简单估计量可得1 630/10163iyy n,样本方差为
11、2212.222s,120N,样本均值的方差估计值为211 10/120212.22219.453 710fv ysn。利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为0.971,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。回归估计量的精度最高的回归系数的估计值为14.5680.9711.36810.341xss。以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得
12、到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 现在可以得到肉牛现重量的回归估计量为_lryyXx,代入数值可以得到_159.44lry。回归估计量_lry的方差为 _2211lrlrfVyMSEySn ,方差的估计值为2_211lrfv ysn ,代入相应的数值,2_2111.112lrfv ysn ,显然有_lrv yv y 。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。第 3 章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,
13、而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对几种分层方法的判断如下:(1)选择性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查
14、研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要求。所以,按照职称进行分层是合理的。(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本
15、的分布比较均匀,比简单随机抽样更加方便实施。3.2 解:设计的方案如下:第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的入样概率相等,因为每个专业的人数比例未知,8 个人的样本量无法在每个层之以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 间进行分配。所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出
16、这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出 8 个人。这样就可以保证每个人入选的概率是相等的。第二种方案:也可以按照性别进行分类,对他们进行编号,为 1800,使得男生的编号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所对应的性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出 8 个新生。这样就可以保证所有的新生的入样概率是相同的。第三种方案:随机地把所有的人分成 8 组,而且使得每组的人都是 100 个人,这样分组完成后,每个组的新生进行编号为 1100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所对应的新生,从而抽取出 8 个人
17、。3.3 解:(1)首先计算出每层的简单估计量,分别为_12311.2,25.5,20yyy,其中,123256,420,168,844NNNN,则每个层的层权分别为;3121230.303 3,0.497 6,0.199 1NNNWWWNNN 则利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量_hhstyW y,代入数值可以得到_20.07hhstyW y。购买彩票的平均支出的的估计值的方差为3_2211hhhsthhfVyWSn ,此方差的估计值为3_2211hhhsthhfv yWsn ,根据数据计算可以得到每层的样本方差分别为:22212194.4,302.5,355.556s
18、ss 其中12310nnn,代入数值可以求得方差的估计值为_9.473 1stv y ,则估计的标准差为_9.473 13.08ststs yv y 。(2)由区间估计可知相对误差限满足 _11ststststyYrYPyYrYPV yV y 所以_2strYzV y,2_2strYV yz。以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 样本均值的方差为2232221111hhhsthhhhhhhfW SV yWSW SnnN,从而
19、可以得到 在 置 信 度 为,相 对 误 差 限 为r条 件 下 的 样 本 量 为22222_22211hhhhhhsthhhhW SW SnV yW SrY zW SNN。对于比例分配而言,有hhW成立,那么22_221hhhhW SnrY zW SN,把相应的估计值和数值195%,10%r 代入后可以计算得到样本量为186n,相应的在各层的样本量分别为1231256.457,92.693,18636nnnnn。按照内曼分配时,样本量在各层的分配满足hhhhhW SW S,这时样本量的计算公式变为22_221hhhhW SnrY ZW SN,把相应的数值代入后可得175n,在各层中的分配情
20、况如下:1231233,87,18666nnnnn。3.4 解:(1)首 先 计 算 得 到 每 层 中 在 家 吃 年 夜 饭 的 样 本 比 例 为1234560.9,0.933 3,0.9,0.866 7,0.933 3,0.966 7pppppp,那么根据每一层的层权,计算得到该市居民在家吃年夜饭的样本比例为6192.4%sthhhpW p。每一层中在家吃年夜饭的样本比例的方差为11111hhhhhhhhhhhhhPPfNNnV pPPnNNn,则该市居民在家吃年夜饭的比例的方差,在1hhNN 的条件下,266221111hhhsthhhhhNNnV pW V pNN 621111hh
21、hhhhhhhPPPPWfnn,而其中每层的吃年夜饭的样本比例的方差的估计值为11111hhhhhhhhhhhhhppfnNnv pppnnNn,则样本比例的方差的估计值以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 为 662211111hhsthhhhhhhppv pW v pWfn,把相应的数值代入计算可得方差的估计值为 43.960 1 10stv p,从而可以得到该估计值的标准差为 0.019 9sts p。(2)利用上题的
22、结果,2222222211hhhhhhsthhhhW SW SnV pW SrP ZW SNN,这里的方差是211hhhhhNSPPN,在1hhNN 的条件下,近似有21hhhSPP。比例分配的条件下,有hhW成立,那么22221hhhhW SnrP zW SN,把相应的估计值和数 值代入可 以求得最终 的样本量 应该是266 3n,样本量在各 层 的分配是123479.34479,559.23559,372.83373nnn,4239.67 240n,56426.08426,585.86586nn。内曼分配条件下,hhhhhW SW S,则22221hhhhW SnrP ZW SN,代入相应
23、的估计值 和数值可 以计算得到 样本量为256 5n,在各层中 样本量的 分 配为123456536,520,417,304,396,392nnnnnn。3.5 解:总体总共分为 10 个层,每个层中的样本均值已经知道,层权也得到,从而可以计算得到该开发区居民购买冷冻食品的平均支出的估计值为10175.79sthhhyW y。下一步计算平均支出的 95%的置信区间,首先计算购买冷冻食品的平均支出的估计值的方差,其中10_2211hsthhhhfVyWSn ,但是每层的方差是未知,则样本平均支出的方差的估计值为10_2211hsthhhhfv yWsn ,每个层的样本标准差已知,题目中已经注明各
24、层的抽样比可以忽略,计算可以得到10_221159.825 4hhhsthhfv yWsn 。则这个开发区的居民以及编号为的这个单元中每个单元的入样概率都是抽中的编号为的每个目相同之处不同之处都是根据从一个总体中抽样得到的样本然后定义样本均值近似服从正态分布抽样理论中样本是从有限总体中按放回的抽样优秀学习资料 欢迎下载 购买冷冻食品的平均支出195%置信区间为_22,ststyzv yyzv y _1.96,1.96ststyv yyv y 代入数值后,可得最终的置信区间为60.63,90,95。3.6 解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到总体的比例为310.
25、28hhhPW P,则样本量为 100 的简单随机样本的样本比例的方差为 21fV pSn,不考虑有限总体校正系数,21V pSn,其中 211NSPPN,在1NN 的条件下,通过简单随机抽样得到的样本比例的方差为 231112.016 10fV pSPPnn 通过分层抽样得到的样本比例的方差为 221hsthhhfV pWSn,但是因为不考虑有 限总体校正系数,而且抽样方式是比例抽样,所以有hhhhNnWNn成立,样本比例的方差近似为 221hhsthhW SV pW Snn。对于每一层,分别有211hhhhhNSPPN,在1hhNN 的条件下,近似的有21hhhSPP成立,有 222123
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样技术 2023 抽样 技术 第四 习题 详细 解析 答案
限制150内