统计学资料及课后习题答案.pdf
第 1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。早 下主要内容学习要点1.1 统计及其应用领域什么是统计学概念:统计学,描述统计,推断统计。统计的应用领域统计在工商管理中的应用。统计的其他应用领域。1.2 数据的类型分类数据、顺序数据、数值型数据概念:分类数据,顺序数据,数值型数据。不同数据的特点。观测数据和实验数据概念:观测数据,实验数据。截面数据和时间序列数据概念:截面数据,时间序列数据。1.3 数据来源数据的间接来源统计数据的间接来源。二手数据的特点。数据的直接来源A概念:抽样调查,普查。数据的间接来源。数据的收集方法。调查方案设计调查方案的内容。数据质量概念。抽样误差,非抽样误差。统计数据的质量。1.4 统计中的几个基本概念总体和样本概念:总体,样本。参数和统计量概念:参数,统计量。变M概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。二、主要术语1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。23456789描述统计:研究数据收集、处理和描述的统计学分支。推断统计:研究如何利用样本数据来推断总体特征的统计学分支。分类数据:只能归于某一类别的非数字型数据。顺序数据:只能归于某一有序类别的非数字型数据。数值型数据:按数字尺度测量的观察值。观测数据:通过调查或观测而收集到的数据.实验数据:在实验中控制实验对象而收集到的数据。截面数据:在相同或近似相同的时间点上收集的数据。1 0.时间序列数据:在不同时间上收集到的数据。11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。12.普查:为特定目的而专门组织的全面调查。13.总 体:包含所研究的全部个体(数据)的集合。14.样本:从总体中抽取的一部分元素的集合。15.样本容量:也称样本量,是构成样本的元素数目。16.参数:用来描述总体特征的概括性数字度量。17.统计量:用来描述样本特征的概括性数字度量。18.变量:说明现象某种特征的概念。19.分类变量:说明事物类别的一个名称。20 .顺序变量:说明事物有序类别的个名称。21.数值型变量:说明事物数字特征的个名称。22.离散型变量:只能取可数值的变量。23.连续型变量:可以在一个或多个区间中取任何值的变量。第 2 章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。早 下主要内容学习要点2.1 数据的预处理数据审核数据审核的目的。原始数据和二手数据的审核内容。数据排序数据排序的目的。分类数据和数值型数据的排序方法。数据筛选数据筛选的目的。用 Excel进行数据筛选。数据透视表数据透视表的用途。用 Excel进行数据透视。2.2 品质数据的整理与展示分类数据的整理与图示 概念:频数,频数分布,比例,百分比,比率。用 Excel制作分类数据的频数分布表。分类数据的图示:条形图,帕累托图,对比条形图,饼图。顺序数据的整理与图示 概念:累积频数,累积频率。累积频数分布图。2.3 数值型数据的整理与展示数据分组 概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。频数分布表的制作步骤。用 Excel制作频数分布表。数值型数据的图示 直方图的绘制。茎叶图的绘制。箱线图的绘制。直方图与条形图的区别。茎叶图与直方图的区别。线图的绘制。散点图的绘制。气泡图的绘制。雷达图的绘制。2.4 合理使用图表鉴别图形优劣的准则 图形应包括的基本特征。鉴别图形优劣的准则。统计表的设计统计表的结构。统计表的设计。二、主要术语24.频数:落在某一特定类别(或组)中的数据个数。25.频数分布:数据在各类别(或组)中的分配。26.比 例:一个 样 本(或总体)中各个部分的数据与全部数据之比。27.比 率:样 本(或总体)中各不同类别数值之间的比值。28.累积频数:将各有序类别或组的频数逐级累加起来得到的频数。29.数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。30.组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。31.组距:一个组的上限与下限的差。32.组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。33.直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。34.茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。35.箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5 个特征值绘制而成的、反应原始数据分布的图形。第3章数据的概括性度量一、学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。早T主要内容学习要点3.1 集中趋势的度量众数 概念:众数。众数的特点。中位数和分位数 概念:中位数,四分位数。中位数和四分位数的特点。中位数和四分位数的计算。平均数 概念:平均数,简单平均数,加权平均数,几何平均数。简单平均数和加权平均数的计算。平均数的性质。几何平均数的计算和应用场合。众数、中位数和平均数的比较众数、中位数和平均数在分布上的关系。众数、中位数和平均数的特点及应用场合。3.2 离散程度的度量异众比率 概念:异众比率。异众比率的计算和应用场合。四分位差概念:四分位差。四分位差的计算和应用场合。方差和标准差 概念:极差,平均差,方差,标准差。极差的计算和特点。平均差的计算和特点。样本方差和标准差的计算。总体方差和标准差的计算。相对位置的度量 概念:标准分数。标准分数的计算和应用。经验法则。切比雪夫不等式。离散系数概念:离散系数。离散系数的计算。离散系数的用途。3.3 偏态与峰态的度量偏态及其测度 概念:偏态,偏态系数。偏态系数的计算。偏态系数数值的意义。峰态及其测度 概念:峰态,峰态系数。峰态系数的计算。峰态系数数值的意义。用E xcel计算描述统计量。E xcel统计函数的应用。二、主要术语和公式(-)主要术语1.众数:一组数据中出现频数最多的变量值,用 M“表示。2.中位数:一组数据排序后处于中间位置上的变量值,用 表 示。3.四分位数:一组数据排序后处于25%和75%位置上的值。4.平均数:-组数据相加后除以数据的个数而得到的结果。5.几何平均数:个变量值乘积的次方根,用 G,“表示。6.异众比率:非众数组的频数占总频数的比率。7.四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。8.极差:也称全距,一组数据的最大值与最小值之差。9.平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。10 .方差:各变量值与其平均数离差平方的平均数。11.标准差:方差的平方根。12.标准分数:变量值与其平均数的离差除以标准差后的值。13.离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。14.偏态:数据分布的不对称性。15.偏态系数:对数据分布不对称性的度量值。16.峰 态:数据分布的平峰或尖峰程度。17.峰态系数:对数据分布峰态的度量值。(-)主要公式名称公式中位数Me=,丑)为奇数儿广/为偶数简单样本平均数x=n加权样本平均数X=-n儿何平均数Gm X lxx2x-xxn=他.异众比率7 _ Z f i-f m _ 1 f n ir z力 匚四分位差Qa Qu QL极差R=max(xz)-min(x.)简单平均差汽1元,-司M-n加权平均差-和M-n简单样本方差E(x,-x)252=-n-1简单样本标准方差a一元产S=V-V n-1加权样本方差2(%-力6 2 =-n-l加权样本标准差力S =1,=1(n-1标准分数x.-x号 一s离散系数s匕=-X未分组数据的偏态系数/_、3SK=-y(-1)(-2)7 s J分组数据的偏态系数(例 厂 对4S K=-.-/K未分组数据的峰态系数Ka+1)Z 伪 一 X)J 3(Z(M X)2)2(1)、(Z 7-1)(/7-2)(/7-3)分组数据的峰态系数t(M-/K=K 3-3ns第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点4.1抽样与抽样分布概率抽样方法 概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统抽样,整群抽样。用Excel抽取简单随机样本。抽样分布 概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。中心极限定理。样本均值抽样分布的特征。样本均值的抽样分布与总体分布的关系。样本比例抽样分布的形式和特征。样本方差抽样分布的形式。4.2参数估计的一般问题估计量与估计值 概念:估计量,估计值。点估计与区间估计 概念:点估计,区间估计,置信区间,置信水平。置信区间构建的原理。置信区间的解释。评价估计量的标准 概念:无偏性,有效性,一致性。4.3总体均值的区间估计正 态 总 体、方差已知,或非正态总体、大样本正态总体、方差已知时的置信区间。非正态总体、大样本时的置信区间。用E x c e l计算给定a的正态分布的临界值。正 态 总 体、方差未知、小样本 正态总体、方差已知时的小样本置信区间。正态总体、方差未知时的小样本置信区间。用E x c e l计算给定a的t分布的临界值。4.4总体比例的区间估计总体比例的区间估计总体比例的置信区间。4.5总体方差的区间估计总体方差的区间估计总体方差的置信区间。用E x c e l计算给定a的/分 布 的 临 界值。4.6样本容量的确定估计总体均值时样本容量的确定 样本容量的计算方法。估计总体比例时样本容量的确定 样本容量的计算方法。二、主要术语和公式(一)主要术语36.简单随机抽样:也称纯随机抽样,它是从含有N个元素的总体中,抽取个元素作为样本,使得总体中的每一个元素都有相同的机会(概 率)被抽中。37.简单随机样本:从含有N个元素的总体中,抽取个元素作为样本,使得总体中每一个样本量为的样本都有相同的机会(概 率)被抽中。38.重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取个元素为止。39.不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取个元素为止。40 .分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。41.系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取个元素形成一个样本。42.整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。43.抽样分布:在重复选取样本量为的样本时,由样本统计量的所有可能取值形成的相对频数分布。44.样本均值的抽样分布:在重复选取样本量为的样本时,由样本均值的所有可能取值形成的相对频数分布。45.样本比例抽样分布:在重复选取样本量为的样本时,由样本比例的所有可能取值形成的相对频数分布。46.标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。47.估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。48.估计量:用来估计总体参数的统计量的名称,用符号3表示。49.估计值:用来估计总体参数时计算出来的估计量的具体数值。50 .点估计:用样本统计量。的某个取值直接作为总体参数。的估计值。51.区间估计:在点估计的基础上,给出总体参数估计的一个范围。52.置信区间:由样本统计量所构造的总体参数的估计区间。53.置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。(-)主要公式名称公式总体均值的置信区间(正态总体,b 已知)-.bX%/2 /=yjn总体均值的置信区间(b 未知,大样本)X 士 不总体均值的置信区间(正态总体,O未知,小样本)X 土 2总体比例的置信区间P Za/2抖沔总体方差的置信区间(-l)s 2 V2 ”或的假设检验。23.双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“二”的假设检验。24.第 I 类错误:当原假设为正确时拒绝原假设,犯 第 I 类错误的概率记为a o25.第 II类错误:当原假设为错误时没有拒绝原假设,犯第H类错误的概率通常记为万。26.显著性水平:假设检验中发生第I 类错误的概率,记为a。27.检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。28.拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。29.临界值:根据给定的显著性水平确定的拒绝域的边界值。30.产值:也称观察到的显著性水平,如果原假设4 是正确的,那么所得的样本结果出现实际观测结果那么极端的概率。(二)主要公式名称公式总体均值检验的统计量(正态总体,。已知)cr/Vn总体均值检验的统计量(b 未知,大样本)s/y/n总体均值检验的统计量(正态总体,O未知,小样本)s1总体比例检验的统计量PfI苑(l-兀o)V n总体方差检验的统计量2(一 1)$2b o第6章方差分析一、学习指导本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。它是通过对各观察数据误差来源的分析来判断多个总体均值是否相等。本章首先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想和基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点6.1方差分析的基本问题方差分析及有关术语 概念:方差分析,因子,处理。方差分析的基本思想和原理 概念:组内误差,组间误差,总平方和,组内平方和,组间平方和。误差的分解总平方和、组内平方和、组间平方和的关系。方差分析中的基本假定 方差分析中的3个基本假定。问题的一般提法 方差分析中假设的提法。6.2单因素方差分析数据结构 概念:单因素方差分析。数据结构。分析步骤 概念:总平方和,组内方差,组间方差。假设的提法。总平方和、组内方差、组间方差的计算方法。检验统计量的计算方法。统计决策。方差分析表的结构。用E x c e l进行方差分析。关系强度的测量关系强度的测量方法。6.3方差分析中的多重比较方差分析中的多重比较 多重比较的前提。多重比较的作用。多重比较的方法。二、主要术语和公式(一)主要术语31.方差分析(A N O V A);检验多个总体均值是否相等的统计方法。32.因素:也称因子,是方差分析中所要检验的对象.33.水平:也称处理,是因素的不同表现。34.组内误差:来自水平内部的数据误差。35.组间误差:来自不同水平之间的数据误差。36.总平方和:反映全部数据误差大小的平方和,记为SS7;37.组内平方和:反映组内误差大小的平方和,记为SM.38.组间平方和:反映组间误差大小的平方和,记为SSL39.单因素方差分析:只涉及一个分类型自变量的方差分析。40 .组内方差:组内平方和除以相应的自由度。41.组间方差:组间平方和除以相应的自由度。(-)主要公式名称公式组间方差,一组间平方和 SSA自由度 k-组内方差组内平方和 SSEMSE=-=-自由度 n-k方差分析的检验统计量MSEF(k l,n k)关系强度的测量R2 _ SSA(组间SS)SST(息 SS)多重比较的LSDLSD-Q/2、MS(+)/ni第7章相关与回归分析一、学习指导相关与回归是研究变量之间关系的统计方法,该方法广泛应用于自然科学和社会科学的各个领域。本章首先介绍相关分析方法,然后介绍一元线性回归和多元线性回归分析方法。本章各节的主要内容和学习要点如下表所示。早 R主要内容学习要点7.1 变量间关系的度量变量间的关系 概念:函数关系,相关关系。相关关系的特点。相关关系的描述与测度 概念:相关系数。相关分析的内容。散点图的绘制和分析。相关系数的计算。相关系数的性质。相关系数的显著性检验 相关系数检验的目的。相关系数检验的程序。7.2 一元线性回归一元线性回归模型 概念:回归模型,回归方程,估计的回归方程。回归分析的内容。回归模型的基本假定。参数的最小二乘估计 概念:最小二乘法。瓦和总的计算。的解释。用 Excel进行回归。回归直线的拟合优度 概念:总平方和,回归平方和,残差平方和,判定系数,估计量的标准误差。判定系数的计算和解释。判定系数与相关系数的关系。估计量的标准误差的计算和解释。显著性检验 线性相关检验的目的。线性关系显著性检验的程序。回归系数检验的目的。回归系数检验的程序。Excel输出的回归结果的解释和应用。利用回归方程进行估计和预测 概念:平均值的点估计,个别值的点估计,平均值的置信区间估计,个别值的预测区间估计。平均值的点估计和个别值的点估计的区另 限平均值的置信区间估计和个别值的预测区间估计的区别。点估计和区间估计的计算方法。7.3 多元线性回归多元回归模型与回归方程 概念:多元线性回归模型,多元线性回归方程,估计的多元线性回归方程。偏回归系数的解释。参数的最小二乘估计参数的最小二乘估计方法。用 Excel进行回归。回归方程的拟合优度概念:多重判定系数,修正的多重判定系数,估计标准误差。判定系数的实际意义。估计标准误差的实际意义。Excel回归结果的解释。显著性检验线性关系检验与回归系数检验的区别。线性关系检验的程序。回归系数检验的程序。Excel回归结果的解释和应用。二、主要术语和公式(-)主要术语42.相关关系:变量之间存在的不确定的数量关系。43.相关系数:也称Pearson相关系数,是根据样本数据计算的度量两个变量之间线性关系强度的统计量。44.因变量:被预测或被解释的变量,用 y 表示。45.自变量:用来预测或用来解释因变量的一个或多个变量,用 x 表示。46.回归模型:描述因变量y 如何依赖于自变量入和误差项的方程。47.回归方程:描述因变量y 的期望值如何依赖于自变量x 的方程。48.估计的回归方程:根据样本数据求出的回归方程的估计。49.最小二乘法:也称最小平方法,使因变量的观察值先与估计值少之间的离差平方和达到最小来求得瓦和6 的方法。50 .判定系数:回归平方和占总平方和的比例,记为尺2。51.估计量的标准误差:均方残差(,岭)的平方根,用具来表示。52.y 的平均值的点估计:利用估计的回归方程,对于尤的一个特定值x 0,求出y 的平均值的一个估计值E(y0)。53.y 的个别值的估计值:利用估计的回归方程,对于x 的 一 个 特 定 值 求 出 y 的一个个别值的估计值%。54.),的平均值的置信区间估计:对 x 的一个给定值与,求出y 的平均值的区间估计。55.y 的个别值的预测区间估计:对 x 的一个给定值与,求出y 的一个个别值的区间估计。56.多元线性回归模型:描述因变量y 如何依赖于自变量X1,%,5 和误差项 的方程。57.多元线性回归方程:描述y 的期望值如何依赖于看,修,4 的方程。58.估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。59.多重判定系数:在多元回归中,回归平方和占总平方和的比例。60.修正的多重判定系数:用模型中自变量的个数和样本量进行调整的多重判定系数,记为(二)主要公式名称公式相关系数祝斫工x x yr 尤4后x j心 炉-W W相关系数检验的统计量 K 2)V I-/回归方程的截距A=y-即回归方程的斜率(回归系数)汇 七%-Z w Z%o _ /=1 i=/=!夕 “r,VEx.2-i=l i=l 7判定系数p2SSR z ()2SST E(y,-y)2估计标准误差Z(府库n-2线性关系检验的统计量F二师 1 Fn-2)SSEjn-2 回归系数检验的统计的统计量t=邑sy的平均值的置信区间鱼 土“25e1 (%-初2J%“无产i=ly的个别值的预测区间iI 1 I(尤0 T)2ni=l修正的多重判定系数n-k 第8章时间序列分析和预测一、学习指导分析时间序列数据的主要目的是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列和非平稳序列的一些简单预测方法。本章各节的主要内容和学习要点如下表所示。n*r-早 R主要内容学习要点8.1 时间序列及其分解时间序列及其分解 概念:时间序列,平稳序列,非平稳序列,趋势,季节性,周期性,随机性。时间序列的分解模型。8.2 时间序列的描述性分析图形描述 时间序列的图形描述。增长率分析 概念:增长率,环比增长率,定基增长率,平均增长率,年度化增长率,增 长 1%绝对值。一般增长率的计算与分析。平均增长率的计算与分析。年度化增长率的计算与分析。增长率分析中应注意的问题。增长现绝对值的计算和应用。8.3 时间序列的预测程序确定时间序列的成分 时间序列的预测步骤。趋势成分的确定方法。季节性成分的确定方法。选择预测方法 时间序列的类型和预测方法的预测方法的评估 概念:平均误差,平均绝对误差,均方误差,平均百分比误差和平均绝对百分比误差。各种误差的计算方法。8.4 平稳序列的预测简单平均法简单平均法预测。移动平均法 移动平均法预测。用 Excel进行移动平均预测。指数平滑法 指数平滑法预测。用 Excel进行指数平滑预测。8.5 趋势型序列的预测线性趋势预测直线趋势方程的求法。直线趋势方程预测。非线性趋势预测 二次曲线预测。指数趋势预测,指数曲线和直线的区别。修正指数曲线预测。龚伯茨曲线预测。L o g istic曲线预测8.6 复合型序列的分解预测确定并分离季节成分季节指数的计算。分离季节成分。建立预测模型并进行预测建立预测模型。计算最后的预测值最终预测值的计算。二、主要术语和公式(-)主要术语61.时间序列:同一现象在不同时间上的相继观察值排列而成的序列。62.平稳序列:基本上不存在趋势的序列。63.非平稳序列:包含趋势性、季节性或周期性的序列。64.趋势:也称长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。65.季节性:也称季节变动,是指时间序列在一年内重复出现的周期性波动。66.周期性:也称循环波动,是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。67.随机性:也称不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性波动。68.增长率:也称增长速度,是指时间序列中报告期观察值与基期观察值之比减1 后的结果,用%表示。69.平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速度)的几何平均数减1 后的结果。70 .增长现绝对值:增长率每增长一个百分点而增加的绝对数量。71.简单平均法预测:根据过去已有的f期观察值通过简单平均来预测下一期的数值。72.移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。73.指数平滑法预测:对过去的观察值加权平均进行预测的 种方法,该方法使得第r+1期的预测值等于,期的实际观察值与第t期指数预测值的加权平均值。(-)主要公式名称公式环比增长率G,=工-1%定基增长率为 丫。平均增长率JLL./1-X X X 1-n丫。匕 射 5年度化增长率平均预测误差(匕-丹)ME=K-n平均绝对预测误差MAD=Z.一 n均方预测误差汽(匕K)2MSE=-n平均百分比预测误差(y _ p、y-x i o o.YMPE=:-乙n简单平均法预测i i /工+1=;区+丫2+,一+匕)=;工 工t t i=移动平均法预测P _ y _ Y”k+1+匕 M +2+匕-1 +匕巴+1 _ 乙_ Jk指数平滑法预测F,+=aY,+(l-a)F,线性趋势方程的截距和斜率少-(刀)2a=Y-5f二次曲线的标准方程组VZ Y na+b t+c t2=+c Z=a Z 产+Z?Z/+c Z 指数曲线的标准方程组VZ l g Y =l g a +l g b L H g y =l g a +lg2修正指数曲线的未知数I b T )第9章 指 数一、学习指导指数是应用于经济领域的一种特殊统计方法。本章首先介绍指数的概念和分类,然后介绍加权指数的编制方法,最后介绍实际中几种常用的价格指数。本章各节的主要内容和学习要点如下表所示。上:.一H r早 下主要内容学习要点9.1引言指数的概念和分类 概念:指数,个体指数,综合指数,简单指数,加权指数,时间性指数,区域性指数。9.2加权指数加权综合指数 概念:加权综合指数。加权综合指数的编制。加权平均指数 概念:加权平均指数。加权平均指数的编制。价值指数与指数体系 概念:价值指数,指数体系。指数体系的应用。9.3儿种常用几种常用的价格指数 概念:零售价格指数,居民消费价格指数,的价格指数生产价格指数,股票价格指数。零售价格指数和居民消费价格指数的区别。居民消费价格指数的作用。二、主要术语和公式(-)主要术语74.指数:测定多个项目在不同场合下综合变动的相对数。75.加权综合指数:通过加权来测定一组项目的综合变动状况的指数。76.加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。77.价值指数:由两个不同时期的价值总量对比形成的指数。78.指数体系:由价值指数及其若干个因素指数构成的数量关系式。79.零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。80.居民消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。81.生产价格指数:测量在初级市场上所售货物(即在非零售市场上首次购买某种商品时)价格变动的一种价格指数。82.股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数。(-)主要公式名称公式加权综合价格指数T ZPMIp=VZ PO/加权综合销售量指数J:Z PO/Z P o lo加权平均价格指数,X PI%IP=iE PMPl Po加权平均销售量指数L P。%i _%X Po%价值指数v=VP o 9 o附录:教材各章习题答案第1章统计与统计数据1.1 (1 )数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。1.2(1 )总体是“该城市所有的职工家庭”,样本是“抽 取 的2 0 0 0个职工家庭”;(2 )城市所有职工家庭的年人均收入,抽取的“2 0 0 0个家庭计算出的年人均收入。1.3 (1)所 有I T从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。1.5(喳。1.6(喳。第2章数据的图表展示2.1(1)属于顺序数据。(2)频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数/频率频率/%A1 41 4B2 12 1C3 23 2D1 81 8E1 51 5合计1 0 01 0 0(3 )条 形 图(略)(4)帕累托图(略,2.2(1)频数分布表如下4 0个企业按产品销售收入分组表按销售收入分组/万元企业数/个频率/%向上累积向下累积企业数频率企业数频率1 0 0以下51 2.551 2.54 01 0 0.01 0 0 1 1 092 2.51 43 5.03 58 7.51 1 0 1 2 01 23 0.02 66 5.02 66 5.01 2 0-1 3 071 7.53 38 2.51 43 5.01 3 0-1 4 041 0.03 79 2.571 7.51 4 0以上37.54 01 0 0.037.5合计4 01 0 0.0(2)某管理局下属4 0个企分组表2.3 频数分布表如下按销售收入分组/万元企业数/个频率/%先进企业1127.5良好企业1127.5一般企业922.5落后企业922.5合计40100.0某百货公司日商品销售额分组表按销售额分组/万元频数/天频率/%25-30410.03035615.035401537.54045922.545-50615.0合计40100.0直 方 图(略)。2.4 茎叶图如下(2)频数分布表如下100只灯泡使用寿命非频数分布茎叶数据个数18 8 9320 1 13 3 6 8 8 8 9 9 91231 3 5 6 9541 2 3 6 6 7650 1 2 74箱线 图(略)。(1)排序略。(3)直方 图(略)。(4)茎叶图如下按使用寿命分组/小时灯泡个数/只频率/%6506602266067055670680666806901414690-7002626700-7101818710-720131372073010107307403374075033合计100100茎叶2.82.6656667686970717273741 81 4 5 6 81 3 4 6 7 91 1 2 3 3 3 4 5 50 0 1 1 1 1 2 2 20 0 1 1 2 2 3 4 50 0 2 2 3 3 5 6 70 1 2 2 5 6 7 8 93 5 61 4 75367983688 9 94 4 5 5 6 66 7 7 8 8 88 96 7 7 8 8 8 8 9 99(1)频数分彳7表如下按重量分组频率/包40424244444646484850525252545456565858-606062合计2371617102081043100(2)直方 图(略)。(3)食品重量的分布基(1)频数分彳本上是对称的。7表如下按重量误差分组频数/个1020203030-40405050606070708080-90057813962合计50(2)直 方 图(略)。(1)属于数值型数据。(2)分组结果如下分组天数/天-25-20-20-1568-1 5-1 01 0-1 0-51 3-5-01 20 545 1 07合计6 0(3)直方图(略)。2.9(1 )直方图(略)。(2)自学考试人员年龄的分布为右偏。2.10(1)茎叶图如下A班树茎B班数据个数树叶树叶数据个数035 9214404 4 8429 751 2 2 4 5 6 6 7 7 7 8 91 21 19 7 6 6 5 3 3 2 1 1 0601 1 2 3 4 6 8 892 39 8 8 7 7 7 6 6 5 5 5 5 5 4 4 4 3 3 3 2 1 007001 1 3 4 4 9876 6 5 5 2 0081 2 3 3 4 5666 3 2 2 2 0901 1 4 5 6601 00003(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。2.11(啕。2.12(略。2.13(略。2.14(啕.2.15 箱线图如下:(特征请读者自己分析)各城市相对湿度箱线图8575655545。工工。一二X&工。王:T Min-MaxI I 25%-75%北 京 长 春 南 京 郑 州 武 汉 广 州 成 都 昆 明“洲 西 安 0 Median value第 3 章数据的概括性度量3.1(1 )M o =1 0;Me=1 0;元=9.6。(2)QL=5.5;Q u=1 2。(3 )s=4.2 o(4 )左偏分布。3.2(1)%=?也=2 3。(2)=5.5;Qu=1 2。(3 )x-24;s-6.6 5。(4)S K =1.08;K=。77。(5)略。3.3(1 )略。(2)x =7;5 =0.7 1 o(3)%=0.1 02;v2=0.2 7 4。(4)选方法一,因为离散程度小。3.4(1 )亍=2 7 4.1 (万元);M e=2 7 2.5。(2)C i =2 6 0.2 5;如=2 9 1.2 5。(3)5 =2 1.1 7 (万元 33.5 甲企业平均成本=1 9.4 1 (元),乙企业平均成本=1 8.2 9 (元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。3.6(1 )元=4 2 6.6 7 (万元);s =1 1 6.4 8(万元)。(2)S K=0.2 03;K=-0.6 8 8 3.7(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。3.8(1)女生的体重差异大,因为女生其中的离散系数为0.1 大于男生体重的离散系数0.08。(2)男生:x =2 7.2 7 ),5 =2.2 7 (磅);女生:x =2 2.7 3 磅),5 =2.2 7 (磅;(3 )6 8%;(4)9 5%.3.9 通过计算标准化值来判断,乙=1,Zs=0.5,说明在A项测试中该应试者比平均分数高出 1 个标准差,而在B项测试中只高出平均分数0.5 个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。3.10 通过标准化值来判断,各天的标准化值如下表日期 周 一 周 二 周 三 周 四 周 五 周 六 周 日标准化值 Z 3 0 6 6.2 0.4 4.8 -2.2 0周一和周六两天失去了控制。3.11(1)离散系数,因为它消除了不同组数据水平高地的影响。(2)成年组身高的离散系数:叭=二,=0.02 4;1 7 2.17 3幼儿组身高的离散系数:v5=0.03 2;7 1.3由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。3.12 下表给出了一些主要描述统计量,请读者自己分析。第4章抽样与参数估计方法A方法B方法C平均1 6 5.6平均1 2 8.7 3平均1 2 5.5 3中位数1 6 5中位数1 2 9中位数1 2 6众数1 6 4众数1 2 8众数1 2 6标准偏差2.1 3标准偏差1.7 5标准偏差2.7 7极差8极差7极差1 2最小值1 6 2最小值1 2 5最小值1 1 6最大值1 7 0最大值1 3 2最大值1 2 83.1 3 (1 )方差或标准差;(2)商业类用殳票;(3)略)。4.1(1 )2 000(2)5。(3)正态分布。(4)/2(100-1).4.2(1 )32。(2)0.9 L4.3 0.79.4.4(1 )元25 N(17,22)。(2)x100 N(17,l)o4.5(1 )1.4L (2)1.41,1.41,1.34。4.6(1 )0.4.(2)0.024。(3)正态分布。4.7(1 )0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。4.8(1 )。*=2.14;(2)=4.2;(3)(115.8,124.2)。4.9(8 78 19,121301 4.10(1 )8 1+1.9 7;(2)8 1 2.35;(3)8 1+3.104.11(1 )(24.11,25.8 9 );(2)(113.17,126.03);(3)(3.136,3.702)4.12(1 )(8 68 7,9 113);(2)(8 734,9 066);(3)(8 761,9 039);(4)(8 68 2,9 118)。4.13(2.8 8,3.76);(2.8 0,3.8 4);(2.63,4.01).4.14(7.1,1