统计学高教第三版课后复习资料.docx
《统计学高教第三版课后复习资料.docx》由会员分享,可在线阅读,更多相关《统计学高教第三版课后复习资料.docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学原理 课后答案第一章1. 什么是统计学?怎样理解统计学及统计数据的关系?答:统计学是一门搜集、整理、显示和分析统计数据的科学。统计学及统计数据存在亲密关系,统计学阐述的统计方法来源于对统计数据的探讨,目的也在于对统计数据的探讨,分开了统计数据,统计方法以致于统计学就失去了其存在意义。2简要说明统计数据的来源答:统计数据来源于两个方面:干脆的数据:源于干脆组织的调查、视察和科学试验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是
2、由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避开的。抽样误差是利用样本推断总体时所产生的误差,它是不行避开的,但可以限制的。4.答:(1)有两个总体:A品牌全部产品、B品牌全部产品 (2)变量:口味(如可用10分制表示) (3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。(4)从匹配样本的视察值中推断两品牌口味的相对好坏。第二章、统计数据的描绘思索题1描绘次数安排表的编制过程答:分二个步骤:(1) 依据统计探讨的目的,将数据按分组标记进展分组。按品质标记进展分组时,可将其每个详细的表现作为一个组,或者几个表现合并成一个组,这取决于分组的
3、粗细。按数量标记进展分组,可分为单项式分组及组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。统计分组应遵循“不重不漏”原则(2) 将数据安排到各个组,统计各组的次数,编制次数安排表。2说明洛伦兹曲线及其用处答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹依据意大利经济学家帕累托提出的收入安排公式绘制成的描绘收入和财宝安排性质的曲线。洛伦兹曲线可以视察、分析国家和地区收入安排的平均程度。3. 一组数据的分布特征可以从哪几个方面进展测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标
4、准差、离散系数、偏态系数和峰度系数。4 怎样理解均值在统计中的地位?答:均值是对全部数据平均后计算的一般程度的代表值,数据信息提获得最充分,具有良好的数学性质,是数据误差互相抵消后的客观事物必定性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到特别重要的根底地位。受极端数值的影响是其运用时存在的问题。5 比照率数据的平均,为什么采纳几何平均?答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采纳几何平均。6. 简述众数、中位数和均值的特点和应用场合。答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形态及位置角度来考
5、虑的,而均值是对全部数据计算后得到的。众数简洁计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。7 为什么要计算离散系数?答:在比拟二组数据的差异程度时,由于方差和标准差受变量值程度和计量单位的影响不能干脆比拟,由此需计算离散系数作为比拟的指标。练习题:1.频数分布表如下:效劳质量等级评价的频数分布效劳质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100条形图(略)2(1)采纳等距分组:n=40 全距=152-88=64 取组距为10组数为 64/10=6.4 取6
6、组 频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.03 采纳等距分
7、组全距=49-25=24n=40 取组距为5,则组数为 24/5=4.8 取5组频数分布表:按销售额分组(万元)频数(天数) 25-30 30-35 35-40 40-45 45-50461596 合计 404. (1)排序略。(2)频数分布表如下: 100只灯泡运用寿命非频数分布按运用寿命分组(小时)灯泡个数(只)频率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100直方图(略)。(3)茎叶图如下:6518661456867134679681
8、123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741475 等距分组n=65 全距=9-(-25)=34 取组距为5,组数=34/5=6.8, 取 7组频数分布表:按气温分组天数-25 - -20-20 - -15-15 - -10-10 - -5-5 - 00 - 55 - 108810141447合计657(1)茎叶图如下:A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601
9、123468892398877766555554443332100787812334566632220901145660100003(3) A班考试成果的分布比拟集中,且平均分数较高;B班考试成果的分布比A班分散,且平均成果较A班低8. 箱线图如下:(特征请读者自己分析)9(1)=274.1(万元);Me =272.5 ;QL=260.25;QU =291.25。(2)(万元)。10甲企业平均本钱19.41(元),乙企业平均本钱18.29(元);缘由:尽管两个企业的单位本钱一样,但单位本钱较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均本钱。11=426.67(万元);116.48(万
10、元)13(1)离散系数,因为它消退了不同组数据程度凹凸的影响。 (2)成年组身高的离散系数:; 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。14 表给出了一些主要描绘统计量方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏向2.13标准偏向1.75标准偏向2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128先考虑平均指标,在平均指标相近时考虑离散程度指标。应选择方法A,其均值远高于其他两种方法,同
11、时离散程度及其他两组相近。15(1)风险的度量是一个不断开展的问题,在古典金融理论中,主要采纳标准差这个统计测度来反映,现代金融中,采纳在险值(value at risk)。(2)无论采纳何种风险度量,商业类股票较小(3)个人对股票的选择,及其风险偏好等因素有关。第四章1.总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象。从总体中随机抽取容量为n的样本,它的分布称为样本分布。由样本的某个函数所形成的统计量,它的分布称为抽样分布(如样本均值、样本方差的分布)2.重复抽样和不重复抽样下,样本均值的标准差分别为:因此不重复抽样下的标准差小于重复抽样下的标准差,两者
12、相差一个调整系数3.说明中心极限定理的含义答:在抽样推断中,中心极限定理指出,不管总体听从何种分布,只要其数学期望和方差存在,对总体进展重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论根底。第四章、参数估计1 简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数的估计量有和,假如,称是无偏估计量;假如和是无偏估计量,且小于,则比更有效;假如当样本容量,则是相合估计量。2.说明区间估计的根本原理答:总体参数的区间估计是在肯定的置信程度下,依据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 高教 第三 课后 复习资料
限制150内