统计学高教第三版课后复习资料.docx

上传人：叶***

文档编号：35545783

上传时间：2022-08-22

格式：DOCX

页数：22

大小：222.63KB

( 4.5 )

《统计学高教第三版课后复习资料.docx》由会员分享，可在线阅读，更多相关《统计学高教第三版课后复习资料.docx（22页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、统计学原理课后答案第一章1. 什么是统计学？怎样理解统计学及统计数据的关系？答：统计学是一门搜集、整理、显示和分析统计数据的科学。统计学及统计数据存在亲密关系，统计学阐述的统计方法来源于对统计数据的探讨，目的也在于对统计数据的探讨，分开了统计数据，统计方法以致于统计学就失去了其存在意义。2简要说明统计数据的来源答：统计数据来源于两个方面：干脆的数据：源于干脆组织的调查、视察和科学试验，在社会经济管理领域，主要通过统计调查方式来获得，如普查和抽样调查。间接的数据：从报纸、图书杂志、统计年鉴、网络等渠道获得。3.简要说明抽样误差和非抽样误差答：统计调查误差可分为非抽样误差和抽样误差。非抽样误差是

2、由于调查过程中各环节工作失误造成的，从理论上看，这类误差是可以避开的。抽样误差是利用样本推断总体时所产生的误差，它是不行避开的，但可以限制的。4.答：（1）有两个总体：A品牌全部产品、B品牌全部产品（2）变量：口味（如可用10分制表示）（3）匹配样本：从两品牌产品中各抽取1000瓶，由1000名消费者分别打分，形成匹配样本。（4）从匹配样本的视察值中推断两品牌口味的相对好坏。第二章、统计数据的描绘思索题1描绘次数安排表的编制过程答：分二个步骤：（1）依据统计探讨的目的，将数据按分组标记进展分组。按品质标记进展分组时，可将其每个详细的表现作为一个组，或者几个表现合并成一个组，这取决于分组的

3、粗细。按数量标记进展分组，可分为单项式分组及组距式分组单项式分组将每个变量值作为一个组；组距式分组将变量的取值范围（区间）作为一个组。统计分组应遵循“不重不漏”原则（2）将数据安排到各个组，统计各组的次数，编制次数安排表。2说明洛伦兹曲线及其用处答：洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹依据意大利经济学家帕累托提出的收入安排公式绘制成的描绘收入和财宝安排性质的曲线。洛伦兹曲线可以视察、分析国家和地区收入安排的平均程度。3. 一组数据的分布特征可以从哪几个方面进展测度？答：数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标

4、准差、离散系数、偏态系数和峰度系数。4 怎样理解均值在统计中的地位？答：均值是对全部数据平均后计算的一般程度的代表值，数据信息提获得最充分，具有良好的数学性质，是数据误差互相抵消后的客观事物必定性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到特别重要的根底地位。受极端数值的影响是其运用时存在的问题。5 比照率数据的平均，为什么采纳几何平均？答：比率数据往往表现出连乘积为总比率的特征，不同于一般数据的和为总量的性质，由此需采纳几何平均。6. 简述众数、中位数和均值的特点和应用场合。答：众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形态及位置角度来考

5、虑的，而均值是对全部数据计算后得到的。众数简洁计算，但不是总是存在，应用场合较少；中位数直观，不受极端数据的影响，但数据信息利用不够充分；均值数据提取的信息最充分，但受极端数据的影响。7 为什么要计算离散系数？答：在比拟二组数据的差异程度时，由于方差和标准差受变量值程度和计量单位的影响不能干脆比拟，由此需计算离散系数作为比拟的指标。练习题：1.频数分布表如下：效劳质量等级评价的频数分布效劳质量等级家庭数（频率）频率%A1414B2121C3232D1818E1515合计100100条形图（略）2（1）采纳等距分组：n=40 全距=152-88=64 取组距为10组数为 64/10=6.4 取6

6、组频数分布表如下：40个企业按产品销售收入分组表按销售收入分组（万元）企业数（个）频率（%）向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0（2）某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.03 采纳等距分

7、组全距=49-25=24n=40 取组距为5，则组数为 24/5=4.8 取5组频数分布表：按销售额分组（万元）频数（天数） 25-30 30-35 35-40 40-45 45-50461596 合计 404. （1）排序略。（2）频数分布表如下： 100只灯泡运用寿命非频数分布按运用寿命分组（小时）灯泡个数（只）频率（%）650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100直方图（略）。（3）茎叶图如下：6518661456867134679681

8、123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741475 等距分组n=65 全距=9-（-25）=34 取组距为5，组数=34/5=6.8, 取 7组频数分布表：按气温分组天数-25 - -20-20 - -15-15 - -10-10 - -5-5 - 00 - 55 - 108810141447合计657（1）茎叶图如下：A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601

9、123468892398877766555554443332100787812334566632220901145660100003（3） A班考试成果的分布比拟集中，且平均分数较高；B班考试成果的分布比A班分散，且平均成果较A班低8. 箱线图如下：（特征请读者自己分析）9（1）=274.1（万元）；Me =272.5 ；QL=260.25；QU =291.25。（2）（万元）。10甲企业平均本钱19.41（元），乙企业平均本钱18.29（元）；缘由：尽管两个企业的单位本钱一样，但单位本钱较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均本钱。11=426.67（万元）；116.48(万

10、元)13（1）离散系数，因为它消退了不同组数据程度凹凸的影响。（2）成年组身高的离散系数：；幼儿组身高的离散系数：；由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。14 表给出了一些主要描绘统计量方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏向2.13标准偏向1.75标准偏向2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128先考虑平均指标，在平均指标相近时考虑离散程度指标。应选择方法A，其均值远高于其他两种方法，同

11、时离散程度及其他两组相近。15(1)风险的度量是一个不断开展的问题，在古典金融理论中，主要采纳标准差这个统计测度来反映，现代金融中，采纳在险值（value at risk）。（2）无论采纳何种风险度量，商业类股票较小（3）个人对股票的选择，及其风险偏好等因素有关。第四章1.总体分布指某个变量在总体中各个个体上的取值所形成的分布，它是未知的，是统计推断的对象。从总体中随机抽取容量为n的样本，它的分布称为样本分布。由样本的某个函数所形成的统计量，它的分布称为抽样分布（如样本均值、样本方差的分布）2.重复抽样和不重复抽样下，样本均值的标准差分别为：因此不重复抽样下的标准差小于重复抽样下的标准差，两者

12、相差一个调整系数3.说明中心极限定理的含义答：在抽样推断中，中心极限定理指出，不管总体听从何种分布，只要其数学期望和方差存在，对总体进展重复抽样时，当样本容量充分大，样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论根底。第四章、参数估计1 简述评价估计量好坏的标准答：评价估计量好坏的标准主要有：无偏性、有效性和相合性。设总体参数的估计量有和，假如，称是无偏估计量；假如和是无偏估计量，且小于，则比更有效；假如当样本容量，则是相合估计量。2.说明区间估计的根本原理答：总体参数的区间估计是在肯定的置信程度下，依据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间，使该区间

13、包含总体参数的概率为置信程度。置信程度反映估计的可信度，而区间的长度反映估计的准确度。3说明置信程度为95的置信区间的含义答：总体参数是固定的，未知的，置信区间是一个随机区间。置信程度为95的置信区间的含义是指，在一样条件下屡次抽样下，在全部构造的置信区间里大约有95包含总体参数的真值。4简述样本容量及置信程度、总体方差、允许误差的关系答：以估计总体均值时样本容量确实定公式为例：样本容量及置信程度成正比、及总体方差成正比、及允许误差成反比。2. 解：由题意：样本容量为（1）若（2）若2 解：由题可得：尽管采纳不重复抽样，但因为样本比例很小（不到0.5%），其抽样误差及重复抽样下近似一样，采

14、纳重复抽样的抽样误差公式来计算。为大样本，则在的显著性程度下的置信区间为：当，置信区间为（2.88,3.76）当，置信区间为(2.80,3.84)当，置信区间为(2.63,4.01)5解：假设间隔听从正态分布，平均间隔的95的置信区间为（7.18,11.57）7解：由题意：。因为均超过5，大样本（1）总体中赞成比率的显著性程度为的置信区间为当时，置信区间为（50.7%,77.3%）(2)假如要求允许误差不超过10，置信程度为95，则应抽取的户数：8.此题需先检验两总体的方差是否相等：在5%的显著性程度下，,不回绝原假设认为两总体方差是一样的。（1）即（1.93，17.669）（2）即（0.

15、27，19.32）11.大样本的状况（1）90%置信度下（3.021%，16.979）（2）95%置信度下（1.684%，18.316%）12解：由题可计算：两个总体方差比在95的置信区间为：14解：由题意：则必需抽取的顾客数为：第五章、假设检验思索题11理解原假设及备择假设的含义，并归纳常见的几种建立原假设及备择假设的原则.答：原假设通常是探讨者想搜集证据予以反对的假设；而备择假设通常是探讨者想搜集证据予以支持的假设。建立两个假设的原则有：（1）原假设和备择假设是一个完备事务组。（2）一般先确定备择假设。再确定原假设。（3）等号“”总是放在原假设上。（4）假设确实定带有肯定的主观色调。（5

16、）假设检验的目的主要是搜集证据来回绝原假设。2第一类错误和第二类错误分别是指什么？它们发生的概率大小之间存在怎样的关系？答：第I类错误指，当原假设为真时，作出回绝原假设所犯的错误，其概率为。第II类错误指当原假设为假时，作出承受原假设所犯的错误，其概率为。在其他条件不变时，增大，减小；增大，减小。3什么是显著性程度？它对于假设检验决策的意义是什么？答：假设检验中犯第一类错误的概率被称为显著性程度。显著性程度通常是人们事先给出的一个值，用于检验结果的牢靠性度量，但确定了显著性水同等于限制了犯第一错误的概率，但犯第二类错误的概率却是不确定的，因此作出“回绝原假设”的结论，其牢靠性是确定的，但作出“

17、不回绝原假设”的结论，其牢靠性是难以限制的。4什么是p值？p值检验和统计量检验有什么不同？答：p值是当原假设为真时，检验统计量小于或等于依据实际观测样本数据计算得到的检验统计量值的概率。P值经常作为视察到的数据及原假设不一样程度的度量。统计量检验采纳事先确定显著性程度，来限制犯第一类错误的上限，p值可以有效地补充供给地关于检验牢靠性的有限信息。值检验的优点在于，它供给了更多的信息，让人们可以选择肯定的程度来评估结果是否具有统计上的显著性。5什么是统计上的显著性？答：一项检验在统计上是显著的（回绝原假设），是指这样的（样本）结果不是偶尔得到的，或者说，不是靠机遇可以得到的。显著性的意义在于“非偶

18、尔的练习题3解（1）第一类错误是，供给商供给的炸土豆片的平均重量不低于60克，但店方拒收并投诉。（2）第二类错误是，供给商供给的炸土豆片的平均重量低于60克，但店方没有拒收。（3）顾客会认为第二类错误很严峻，而供给商会将第一类错误看得较严峻。4解：提出假设已知（1）检验统计量为（2）回绝规则是：若，回绝；否则，不回绝（3）由得：，回绝，认为改良工艺能进步其平均强度。5解：设为如今每个家庭每天收看电视的平均时间（小时）需检验的假设为：调查的样本为：大样本下检验统计量为：在0.01的显著性程度下，右侧检验的临界值为因为，回绝，可认为如今每个家庭每天收看电视的平均时间增加了6. 解：

19、提出假设已知：检验统计量回绝，可断定电视运用寿命的方差显著大于VCR7. 解：提出假设：，独立大样本，则检验统计量为：而2.33 因为，回绝，平均装配时间之差不等于5分钟8. 解：匹配小样本提出假设：由计算得：，检验统计量为，不回绝，不能认为广告进步了潜在购置力的平均得分。9. 解：提出假设：已知：大样本，则检验统计量为：而，因为，回绝，可认为信息追求者消极度假的比率显著小于非信息追求者。10. 解：提出假设：由题计算得：检验统计量为：，而，所以回绝，认为两种机器的方差存在显著差异。相关及回来分析思索题1 相关分析及回来分析的区分及联络是什么？答：相关及回来分析是探讨变量之

20、间不确定性统计关系的重要方法，相关分析主要是推断两个或两个以上变量之间是否存在相关关系，并分析变量间相关关系的形态和程度。回来分析主要是对存在相关关系的现象间数量改变的规律性作出测度。但它们在探讨目的和对变量的处理上有明显区分。它们均是统计方法，不能提醒现象之间的本质关系。3.什么是总体回来函数和样本回来函数？它们之间的区分是什么？答：以简洁线性回来模型为例，总体回来函数是总体因变量的条件期望表现为自变量的函数：，或。总体回来函数是确定的和未知的，是回来分析所估计的对象。样本回来函数是依据样本数据所估计出的因变量及自变量之间的函数关系：或。回来分析的目的是用样本回来函数来估计总体回来函数。它们

21、的区分在于，总体回来函数是未知但是确定的，而样本回来函数是随样本波动而改变；总体回来函数的参数是确定的，而样本回来函数的系数是随机变量；总体回来函数中的误差项不行视察的，而样本回来函数中的残差项是可以视察的。4. 什么是随机误差项和残差？它们之间的区分是什么？答：随机误差项表示自变量之外其他变量的对因变量产生的影响，是不行视察的，通常要对其给出肯定的假设。残差项指因变量实际视察值及样本回来函数计算的估计值之间的偏向，是可以观测的。它们的区分在于，反映的含义是不同且可视察性也不同，它们的联络可有下式:5.为什么在对参数进展最小二乘估计时，要对模型提出一些根本的假定？答:最小二乘法只是找寻估计量的

22、一种方法，其找寻到的估计量是否具有良好的性质则依靠模型的一些根本的假定。只有在一系列的经典假定下，最小二乘估计量才是BLUE。15. 为什么在多元回来中要对可决系数进展修正？答：在样本容量肯定下，随着模型中自变量个数的增加，可决系数会随之增加，模型的拟合程度上升，但自由度会损失，从而降低推断的精度，因此须要用自由度来修正可决系数，用修正的可决系数来推断增加自变量的适宜性。16在多元线性回来中，对参数作了t检验后为什么还要作方差分析和F检验？答：t检验仅是对单个系数的显著性进展检验，由于自变量之间存在着较为困难的关系，因此有必要对回来系数进展整体检验，方差分析和F检验就是对回来方程的整体统计显著

23、性进展的检验方法。练习题1. 解：设简洁线性回来方程为：（1）采纳OLS估计：回来系数经济意义：销售收入每增加1万元，销售本钱会增加0.786万元。（2）可决系数为：回来标准误：（3）检验统计量为：所以是显著不为零（4）预料：95%的预料区间为：即（ 664.579 ，674.153）2.（1）（2）负相关关系（3）（4）估计的斜率系数为7.0414，表示航班的正点率每进步1，百万名乘客的投诉次数会下降：7.0414*0.01=0.070414次。（5）假如，则次3.Results of multiple regression for ySummary measuresMultiple

24、 R0.9521R-Square0.9065Adj R-Square0.8910StErr of Est3.3313ANOVA TableSourcedfSSMSFp-valueExplained31937.7485645.916258.20480.0000Unexplained18199.751511.0973Regression coefficientsCoefficientStd Errt-valuep-valueLower limitUpper limitConstant32.99313.138610.51210.000026.399139.5870x10.07160.01484.85390.00010.04060.1026x216.87273.99564.22280.00058.478225.2671x317.90424.88693.66370.00187.637228.17114.5.7. 解（1）样本容量：（2）（3）(4)，(5)用F检验：，整体对有显著影响，但不能确定单个对y的奉献。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 统计学高教第三课后复习资料

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：统计学高教第三版课后复习资料.docx
链接地址：https://www.taowenge.com/p-35545783.html