统计学第三版课后答案.pdf
《统计学第三版课后答案.pdf》由会员分享,可在线阅读,更多相关《统计学第三版课后答案.pdf(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学答案第三版统计学第一章1 什么是统计学怎样理解统计学与统计数据的关系答统计学是一门收集整理显示和分析统计数据的科学统计学与统计数据存在密切关系统计学阐述的统计方法来源于对统计数据的研究目的也在于对统计数据的研究离开了统计数据统计方法以致于统计学就失去了其存在意义2.简要说明统计数据的来源答统计数据来源于两个方面直接的数据源于直接组织的调查观察和科学实验在社会经济管理领域主要通过统计调查方式来获得如普查和抽样调查间接的数据从报纸图书杂志统计年鉴网络等渠道获得3 简要说明抽样误差和非抽样误差答统计调查误差可分为非抽样误差和抽样误差非抽样误差是由于调查过程中各环节工作失误造成的从理论上看这类误
2、差是可以避免的抽样误差是利用样本推断总体时所产生的误差它是不可避免的但可以控制的4 答 1有两个总体A 品牌所有产品B 品牌所有产品2 变量口味如可用1 0 分制表示3 匹配样本从两品牌产品中各抽取1000瓶由1000名消费者分别打分形成匹配样本4 从匹配样本的观察值中推断两品牌口味的相对好坏第二章统计数据的描述思考题1描述次数分配表的编制过程答分二个步骤1按照统计研究的目的将数据按分组标志进行分组按品质标志进行分组时可将其每个具体的表现作为一个组或者几个表现合并成一个组这取决于分组的粗细按数量标志进行分组可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组组距式分组将变量的取值范围区
3、间作为一个组统计分组应遵循不重不漏原则2将数据分配到各个组统计各组的次数编制次数分配表2.解释洛伦兹曲线及其用途答洛伦兹曲线是2 0世纪初美国经济学家统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线洛伦兹曲线可以观察分析国家和地区收入分配的平均程度3 一组数据的分布特征可以从哪几个方面进行测度答数据分布特征一般可从集中趋势离散程度偏态和峰度儿方面来测度常用的指标有均值中位数众数极差方差标准差离散系数偏态系数和峰度系数4怎样理解均值在统计中的地位答均值是对所有数据平均后计算的一般水平的代表值数据信息提取得最充分具有良好的数学性质是数据误差相互抵消后的客
4、观事物必然性数量特征的一种反映在统计推断中显示出优良特性由此均值在统计中起到非常重要的基础地位受极端数值的影响是其使用时存在的问题5对比率数据的平均为什么采用儿何平均答比率数据往往表现出连乘积为总比率的特征不同于般数据的和为总量的性质由此需采用几何平均6简述众数中位数和均值的特点和应用场合答众数中位数和均值是分布集中趋势的三个主要测度众数和中位数是从数据分布形状及位置角度来考虑的而均值是对所有数据计算后得到的众数容易计算但不是总是存在应用场合较少中位数直观不受极端数据的影响但数据信息利用不够充分均值数据提取的信息最充分但受极端数据的影响7为什么要计算离散系数答在比较二组数据的差异程度时由于方差
5、和标准差受变量值水平和计量单位的影响不能直接比较由此需计算离散系数作为比较的指标练习题1频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数频率频率A1414B2121C3232D1818E1515合计100100条形图略2 1采用等距分组n 4 0全 距152-88 6 4取组距为10组数为6410 6 4取6组频数分布表如下4 0个企业按产品销售收入分组表按销售收入分组企业数频率 向上累积向下累积万元 个 企业数频率企业数频率1 0 0以下5125512540100010011092251435035875110120123002665026650120130717533825143
6、501301404100379257175140 以上 3 75 401000375合计 40 10002 某管理局下属4 0个企分组表按销售收入分组万元企业数个频率先进企业11275良好企业11275一般企业9225落后企业9225合计4010003采用等距分组全距 49-25 24n 4 0取组距为5则组数为245 48取5组频数分布表按销售额分组万元 频数天数25-30430-35635-401540-45945-506合计40155101ycner9F665402 5 3 0 3 5 4 04 5 5 0s a l e s4.1排序略2频数分布表如下1 0 0 只灯泡使用寿命非频数分布
7、按使用寿命分组小时灯泡个数只频率6 5 0 6 6 0 2 26 6 0 6 7 0 5 56 7 0 6 8 0 6 66 8 0 6 9 0 1 4 1 46 9 0 7 0 02 62 6700710 18 18710720 13 13720730 10 10730740 3 3740750 3 3合计 100 100直方图略3 茎叶图如下65 1866 14 5 6 867 13 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 98 89 95n6900 1 1 11 2223344556667788700071007201733574 14等距分组112 23
8、456 6677 8 88 922676 5全 距9-22335677 889567899-2534取组距为5组数345 68取7组频数分布表按气温分组天数-25-208-20-158-151010-1014-50140545107合计655114141001ycn 8 8eq7erF50-3 0-2 0-1 001 0t e m p t u r e7 1 茎叶图如下A班B班数据个树 叶 树茎树叶 数据个数数03 5 9214 4 0 4 4 8429 751 X X X X X X X X X X 91 21197665332110601123468898239887776655555444
9、333210070011344967665520081233456663222090114563010 0003 A班考试成绩的分布比较集中且平均分数较高B班考试成绩的分布比A班分散且平均成绩较A班低8箱线图如下特征请读者自己分析各城市相对湿度箱线图958575655545Min-25-7535北 京 长 春 南 京 郑 州 武 汉 广 州 成 都 昆 明 兰 州 西 安Median valuex9.1 2741 万元 Me 2725Q 26025Q29125LU2 s 2117万元3mli1 0.甲企业平均成本xi 1 =1941 元1 3mlii 1 xli3m2i乙企业平均成本x2i 3
10、1=1829 元mlii 1 x2i原因尽管两个企业的单位成本相同但单位成本较低的产品在乙企业的产量中所占比重较大因此拉低了总平均成本kx fi ii 111.42667 万元kf ii 1k2x x fi ii 1s=11648 万元kf i 1i 113 1 离散系数因为它消除了不同组数据水平高低的影响42V00242 成年组身高的离散系数s172123V0032幼儿组身高的离散系数s713由于幼儿组身高的离散系数大于成年组身高的离散系数说明幼儿组身高的离散程度相对较大14.表给出了一些主要描述统计量方 法 A方 法 B方法C平均 1656 平均 12873 平均12553126中位数16
11、5中位数129中位数126众数164众数128众数277标准偏差213标准偏差175标准偏差12极差8极差7极差116最小值162最小值125最小值128最大值170最大值132最大值先考虑平均指标在平均指标相近时考虑离散程度指标应选择方法A其均值远高于其他两种方法同时离散程度与其他两组相近15.1 风险的度量是一个不断发展的问题在古典金融理论中主要采用标准差这个统计测度来反映现代金融中采用在险值value at risk2 无论采用何种风险度量商业类股票较小3 个人对股票的选择与其风险偏好等因素有关第四章1 总体分布指某个变量在总体中各个个体上的取值所形成的分布它是未知的是统计推断的对象从总
12、体中随机抽取容量为n 的样本x x x它的分布称为样本分布由1 2 n样本的某个函数所形成的统计量f x x x 它的分布称为抽样分布如样本均值1 2 n样本方差的分布2 重复抽样和不重复抽样下样本均值的标准差分别为22N nn n N 1因此不重复抽样下的标准差小于重复抽样下的标准差两者相差一个调整系数3 解释中心极限定理的含义答在抽样推断中中心极限定理指出不论总体服从何种分布只要其数学期望和方差存在对总体进行重复抽样时当样本容量充分大样本均值趋近于正态分布中心极限定理为均值的抽样推断奠定了理论基础第四章参数估计1.简述评价估计量好坏的标准答评价估计量好坏的标准主要有无偏性有效性和相合性设总
13、体参数的估计量有1和 如 果 E 称是无偏估计量如果和是无偏估计量且D 小于2111 21D 则比更有效如果当样本容量n则是相合估计量2 1 2 1 12 说明区间估计的基本原理答总体参数的区间估计是在一定的置信水平下根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间使该区间包含总体参数的概率为置信水平置信水平反映估计的可信度而区间的长度反映估计的精确度3 .解释置信水平为9 5%的置信区间的含义答总体参数是固定的未知的置信区间是一个随机区间置信水平为9 5%的置信区间的含义是指在相同条件下多次抽样下在所有构造的置信区间里大约有9 5%包含总体参数的真值4.简述样本容量与置信
14、水平总体方差允许误差的关系2 2Z答 以 估 计 总 体 均 值 时 样 本 容 量 的 确 定 公 式 为 例 nE 2样本容量与置信水平成正比与总体方差成正比与允许误差成反比2解由题意样本容量为n 4 91 51 若 1 5 x 2 1 4 3n4 92 0 0 5 E z 2 1 9 6 2 1 4 3 4 2 0 0 2 8nx 1 2 0 x z 2 x z 2 1 2 0 4 2 0 0 2 8 1 2 0 4 2 0 0 2 83 若 n n1 1 5 7 9 9 7 1 2 4 2 0 0 2 82.解由题可得n 3 6 x 3 3 1 7 s 1 6 0 9尽管采用不重复抽样
15、但因为样本比例很小不到0 5 其抽样误差与重复抽样下近似相同采用重复抽样的抽样误差公式来计算n 3 6 为大样本则在的显著性水平下的置信区间为ssx z 2 x z 2当01 z 2 1 6 4置信区间为288376当005 z 2 1 9 6置信区间为280384当001 z 2 2 5 6置信区间为2634015解假设距离服从正态分布n16x 9375s 4113平均距离的95%的置信区间为x t15 x t 1571811577解由题意n50 p6450因为npn1总体P z2当0 0 5时E均超过5大样本赞 成 比 率 的 显 著 性 水 平 为 的 置lp P 1PP zn2 nP
16、lp6436z 2 196n信 区 间 为13350置信区间为5077732 如果要求允许误差不超过10%置信水平为95%则应抽取的户数212196 0802n26222E018 此题需先检验两总体的方差是否相等H2 2H0 1 212122在 5 的显著性水平下Fs 2 s 2 968 1020 09491 2F0025 136 537 F09751361 F0025 6131 36 028不拒绝原假设认为两总体方差是相同的12 111 90 xxt19s981729984402198172945512005P147即 19317669221 11 95 x xt19s98209398440
17、219 8 2 0 9 3 4 5 5n1 2 0 0 2 5 p1 4 7即 0 2 7 1 9 3 2p 1 Ip 1 p 2 Ip1 1 大样本的情况p 1 p 2 z 2n11 9 0 置信度下4 0 6 03 0 7 04 0 3 0 1 6 4 51 0 6 9 7 92 5 02 5 023 0 2 1 1 6 9 7 92 9 5 置信度下4060307040 3019610 831616841831625025022 221 2.解由题可计算si0242s2 00762 2两个总体方差比 在95%的置信区间为1 2s2 s2s2 s21 21 2 4061435F n In
18、1 Fn In 12 1 21 2 1 21 4.解由题意120z 2196E 20222 2z196120则必须抽取的顾客数为n2139E 2202一是原假设指对总体提出某具体特征的假设二是备择假设是指原假设的互逆事件即总体不具某具体特征的假设备择假设是伴随原假设产生的与原假设相对立的假设所以也叫对立假设或称备选假设当检验证明原假设可信时我们就接受原假设否定备择假设当检验证明原假设不可信时我们就拒绝原假设而接受备择假设第五章假设检验思考题1.1.理解原假设与备择假设的含义并归纳常见的儿种建立原假设与备择假设的原则答原假设通常是研究者想收集证据予以反对的假设而备择假设通常是研究者想收集证据予以
19、支持的假设建立两个假设的原则有1 原假设和备择假设是一个完备事件组2 一般先确定备择假设再确定原假设 3等号=总是放在原假设上4假设的确定带有一定的主观色彩5假设检验的目的主要是收集证据来拒绝原假设2.第一类错误和第二类错误分别是指什么它们发生的概率大小之间存在怎样的关系答 第 I 类错误指当原假设为真时作出拒绝原假设所犯的错误其概率为第I I类错误指当原假设为假时作出接受原假设所犯的错误其概率为在其他条件不变时增大减小增大减小3.什么是显著性水平它对于假设检验决策的意义是什么答假设检验中犯第一类错误的概率被称为显著性水平显著性水平通常是人们事先给出的一个值用于检验结果的可靠性度量但确定了显著
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第三 课后 答案
限制150内