统计学(贾俊平第六版)课后思考题及答案.docx





《统计学(贾俊平第六版)课后思考题及答案.docx》由会员分享,可在线阅读,更多相关《统计学(贾俊平第六版)课后思考题及答案.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章导论L什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。2 .解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。3 .统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,类孀表 现为类别,是用文字来表述的。顺序数据:是只能归于某一有序类别的非数字型数据。虽然也有列别,但这些类别是有 序的。数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。4 .解释分类数据、顺序数据和数值型数据的含义分
2、类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现 为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常 是用数值来表现的,因此也可称为定量数据或数量数据。5 .举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集 合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字 度量;变量是说明现象某种特征的概念。比如我们欲了解某市的中学教育情况,那么该市的 所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽 样规则抽出了
3、10所中学,则这10所中学就构成了一个样本。在这项调查中我们可能会对 升学率感兴趣,那么升学率就是一个变量。我们通常关心的是全市的平均升学率,这里这个 平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就 是统计量。6 .变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。顺序变量:一个变量由顺序数据来记录就称为顺序变量。数值型变量:一个变量由数值型数据来记录就称为数值型变量。离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。连续变量:可以取无穷多个值,其取值是连续不断的,不能一一例举。(当离散变量的取值很多时,也可以将离散变量当作连
4、续变量来处理)7 .举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”。连续型变量,取之连续不断,不能一一列举,比如“温度”。8 .请列举出统计应用的几个例子人口普查,商场民意调查等。9 .请列举出应用统计的几个领域国民经济核算与研究;市场调查分析;社会公共事业统计领域;金融市场领域等第十章方差分析L什么是方差分析?它研究的是什么方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是 否有显著影响。它所研究的是分类变量(自变量)对数值型变量(因变量)的影响。2 .要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法作两两
5、比较十分繁琐,进行检验的次数较多,随着增加个体显著性检验的次数,偶然因 素导致差别的可能性也会增加。而方差分析方法则是同时考虑所有的样本,因此排除了错误 累积的概率,从而避免拒绝一个真实的原假设。3 .方差分析包括哪些类型?它们有何区别类型:单因素方差分析和双因素方差分析。区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因 素涉及两个分类型自变量。4 .方差分析中有哪些基本假定每个总体都应服从正态分布;各个总体的方差。2必须相同;观测值是独立的5 .简述方差分析的基本思想它是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因 变量是否有显著影响。
6、6 .解释因子与处理的含义在方差分析中,所要检验的对象称为因素或因子,因素的不同表现称为水平或处理。7 .解释组内误差和组间误差的含义组内误差(SSE )是指每个水平或组的各样本数据与其组平均值误差的平方和,反映了 每个样本内各观测值的离散状况。组内误差只含有随机误差;组间误差(SSA )是指各组平 均值*与总平均值和误差平方和,反映各样本均值之间的差异程度。8 .解释组内方差和组间方差的含义组内方差(MSE )指因素的同一水平(同一个总体)下样本数据的方差,组间方差(MSA ) 指因素的不同水平(不同总体)下各样本之间的方差。9 .简述方差分析的基本步骤(1)提出假设“0:1 = 2 =出=
7、k (自变量对因变量没有显著影响)Ho:出。=L2幻不全相等(自变量对因变量有显著影响)(2)构造检验统计量计算各样本的均值,计算全部观测值的总均值,计算各误差平方和,计算统计量。(3)统计决策将统计量的值F与给定的显著性水平a的临界值也进行比较,作出对原假设的)夬策。10 .方差分析中多重比较的作用是什么通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。11 .什么是交互作用交互作用是指几个因素搭配在一起会对因变量产生一种新的效应的作用。12 .解释无交互作用和有交互作用的双因素方差分析在双因素方差分析中,如果两个因素对试验结果的影响是相互独立的,分别判断行因素和 列因素对试
8、验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复 双因素方差分析;如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对 结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复 双因素方差分析。第十一章一元线性回归L解释相关关系的含义,说明相关关系的特点含义:变量之间存在的不确定的数量关系为相关关系特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值 可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通 常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。2 .相关分析
9、主要解决那些问题变量间是否存在关系;如果存在,是什么样的关系;变量之间的关系强度如何;样本所 反映的变量之间的关系能否代表总体变量之间的关系3 .相关分析中有哪些基本假定两个变量之间是线性关系;两个变量都是随机变量4 .简述相关系数的性质公式:r - nZxy-ZxZy7n 2 %2一(2 了7n E y2-(y y)2性质:;对称性,即: r的大小与久和y的原点及尺度无关;r仅仅是 %与y之间线性关系的一个度量,不能用于描述非线性关系;r虽然是两个变量之间线性关系 的一个度量5不意味着%和y一定有因果关系。5 .为什么要对相关系数进行显著性检验在对实际现象进行分析时,往往是利用样本数据计算相
10、关系数作为总体相关系数的估计 值,但由于样本相关系数具有一定的随机性,它能否说明总体的相关程度往往同样本容量有一 定关系。因此,为判断样本相关系数对总体相关程度的代表性,需要对相关系数进行显著性检 验。若在统计上是显著的,说明它可以作为总体相关程度的代表值,否则不能作为总体相关程 度的代表值。6 .简述相关系数显著性检验的步骤提出彳眼设:Ho: p= 0; Hi: pO计算检验的统计量:t = |r|V=t(n - 2)l-r2进行决策:确定显著性水平a,若I ta/2,拒绝原假设。7 .解释回归模型、回归方程、估计的回归方程的含义回归模型:描述因变量y如何依赖自变量X和误差项的方程称为回归模
11、型。表示:y =仅)+4 + 回归方程:描述因变量y的期望值如何依赖自变量X的方程称为回归方程。表示:E(y)=氏 + Bix估计的回归方程:根据样本数据求出的回归方程。表示:8 . 一元线性回归模型中有哪些基本假定因变量y与自变量x具有线性关系;在重复抽样中,自变量X的取值是固定的,即假定X是非随机的;误差项是一个期望值为0的随机变量;对于所有的X值,的都相同;误差项是一个服从正态分布的随机变量,且独立,即N(0,。2)。9 .简述参数最小二乘估计的基本原理对于X和y的n对观察值,用距离各观测点最近的一条直线来代表X与y之间的关系与实际 数据的误差比其它任何直线都小。根据这一思想求得直线中未
12、知常数的方法称为最小二乘 法,即使因变量的观察值与估计值之间的离差平方和达到最小来估计0和0的方法。0110 .解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系总平方和:对一个具体的观测值来说,变差的大小可以用实际观测值y与其均值9差(y 一步昧示,而n次观察值的总变差可由这些离差的平方和来表示,称为总平方和(SST)o 回归平方和:由于自变量x的变化引起的y的变化,而其平方和反映了y的总变差中由于 x与y之间的线性关系引起的y的变化部分,它是可以由回归直线来解释的变差部分,称为回 归平方和(SSR)。残差平方和:除了x对y眼的线性影响之外的其他因素对y变差的作用,是不能由回归
13、直 线来解释的变差部分,称为残差平方和(SSE )。关系:SST = SSR + SSE.1L简述判定系数的含义和作用含义:判定系数是对估计的归回方程拟合优度的度量。R2 = $的 一印SST23与作用:判定系数R2测度了回归直线对观测数据的拟合优度,取值范围0,1。越接近1, 表明回归平方和占总平方和的比例越大,拟合程度越好;反之,越接近于0,回归直线的拟合 程度就越差。12 .在回归分析中,F检验和t检验各有什么作用F检验:线性关系检验t检验:回归系数检验13 .简述线性关系检验和回归系数检验的具体步骤线性关系检验提出假设:Ho邙1 = 0; %邙1丰0SSR/计算检验统计量:F =/I
14、= MSRSSE/n 2MSE做出决策:确定显著性水1a,若F 尸。,拒绝原假设。回归系数检验提出假设:Ho邙i = 0;/邙1。0计算检验统计量:做出决策:确定显著性水平a,若t to/2,拒绝原假设。14 .怎样评价回归分析的结果所估计的回归系数硼勺符号是否与理论或事先预期一致;如果理论上认为y与x之间的关系不仅是正的,而且在统计上施(关系显著、系数显著), 那么所建立的回归方程也应该如此;回归模型在多大程度上解释了因变量y取值的差异,可以用判定系数必来回答;考察关于误差项的正态性假定是否成立。15 .什么是置信区间估计和预测区间估计?二者有何区别置信区间估计:是对X的一个给定值,求出y的
15、平均值的区间估计。预测区间估计:是对x的一个给定值%。,求出y的一个个别值的区间估计。y +t c ji(%o-2一(置信区间)y tQ VTTJ 居一十(预测区间)0a/2?丫 - yn20a/21?n (x/-%)2乙 i=lt=l区别:预测区间要比置信区间宽一些。16 .简要说明残差分析在回归分析中的作用 判断对误差项由勺假定是否成立。第十二章多元线性回归1 .解释多元回归模型、多元回归方程、估计的多元回归方程的含义多元回归模型:设因变量为y,k个自变量分别为肛X2,丸,描述因变量y如何依赖于 自变量小,X2,益和误差项的方程成为多元回归模型。表示:y =夕0 + 夕2%2 H+ Bkk
16、 + 多元回归方程:描述因变量y的期望值与自变量%1,犯,丸之间关系的方程。表不:y =夕0 + 夕2%2 + + pkk估计的多元回归方程:用样本统讦量4去估计回归方程中的未知参数012 k价,Bl色,诙时就得到了估计的多元回归方程。表不:2S+S% +% h1-/?%01 12 2k k2 .多元线性回归模型中有哪些基本假定误差项是一个期望值为0的随机变量;对于自变量冗,丸的所有值Y的方差d都相同;误差项是一个服从正态分布的随机变量,且相互独立,即-N(0,愣)。3 解释多重判定系数和调整的多重判定系数的含义和作用多重判定系数:多元回归中的回归平方和占总平方和的比例。R2 = SSR =
17、1 SSESST SST作用:是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计 的回归方程所解释的比例。Q九一1调整的多重判定系数:屋=1 -(1 - R2)(1)n-k-Y作用:用样本容量n和自变量的个数k去调整R2得到,这使得Rq2的值永远小于R2且R/ 的值不会由于模型中自变量个数的增加而越来越接近1,避免增加自变量而高估多重判定系 数。4 解释多重共线性的含义回归模型中两个或两个以上的自变量彼此相关时,称回归模型中存在多重共线性。5 .多重共线性对回归分析有哪些影响变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途;可能对参数估计值的正负号产生影响;
18、特别是用的正负号有可能同预期的正负号相反; 6.多重共线性的判别方法主要有哪些?模型中各对自变量之间显著相关;当模型的线性关系检验(F检验)显著时,几乎所有回归系数仪的t检验却不显著;回归系数的正负号与预期的相反;容忍度(1-R2)与方差扩大因子(VIF= 1)o容忍度越小,多重共线性越严重,1l-Ri2当小于0.1时,存在严重多重共线性。VIF越大,多重共线性越严重,一般认为VIF大于10 时,存在严重多重共线性。7 .多重共线性的处理方法有哪些将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关;如果保留所有自变量,那就应该:避免根据t统计量对单个参数口进行检验;对因变量y值的
19、推断(估计或预测)限定在自变量样本值的范围内。8 .在多元线性回归中,选择自变量的方法有哪些向前选择;向后剔除;逐步回归;最优子集。第十三章时间序列分析和预测1 .简述时间序列的构成要素榛& (Trend);季节性(Seasonality);周期性(Cyclicity);随机性(Irregularvariations)2 .利用增长率分析时间序列时应注意哪些问题当时间序列中的观察值出现0或负数时,不宜计算增长率;不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后, 其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大。3 .简述平稳序列和非平稳序列的含义平稳序列
20、:基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有 波动,但并不存在某种规律,而其波动可以看成是随机的非平稳序列:是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也 可能是几种成分的组合。因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序 列、几种成分混合而成的复合型序列。4 .简述时间序列的预测程序确定时间序列所包含的成分,也就是确定时间序列的类型;找出适合此类时间序列的预测方法;对可能的预测方法进行评估,以确定最佳预测方案;利用最佳预测方案进行预测。5 .简述指数平滑法的含义指数平滑法是指对过去的观察值加权平均进行预测的一种方法。该方法使得第t+1期
21、 的预测值等于t期的实际观察值与第t期预测值的加权平均值。指数平滑法是加权平均的一 种特殊形式,观察值时间越远,其权数也跟着呈指数的下降,因而称为指数平滑。指数平滑 法有一次指数平滑法、二次指数平滑法、三次指数平滑法。一次指数平滑法也可用于对时间 序列进行修匀,以消除随机波动,找出序列的变化趋势。6 .简述复合型序列预测的步骤确定并分离季节成分:计算季节指数,之后将各实际观察值分别初一相应的季节指 数,将季节指数从时间序列中分离出去;建立预测模型并进行预测:对消除了季节成分的时间序列建立适当预测模型,计算出 各期的预测值,用预测值乘以相应的季节指数,得到最终的预测值。7 .简述季节指数的计算步
22、骤计算移动平均值(季度数据采用4项移动平均,月份数据采用12项移动平均),并将其 结果进行“中心化”处理,也就是将移动平均的结果再进行一次二项的移动平均,即得出“中心化 移动平均值(CMA);计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平 均值,然后再计算出各比值的季度(或月份)平均值;季节指数调整。各季节指数的平均数应等于1或ioa,若根据第二步计算的季节比率 的平均值不等于1时,则需要进行调整。具体方法是:将第二步计算的每个季节比率的平均值 除以它们的总平均值。第十四章指数1 .指数的含义和性质含义:广义上,是指任何两个数值对比形成的相对数;狭义上,是指用于测
23、定多个项目在 不同场合下综合变动的一种特殊相对数。实际应用中使用的主要是狭义的指数。性质:相对性;综合性;平均性;代表性;动态性2 .什么是同度量因素?同度量因素在编制加权综合指数中有什么作用含义:是指若干度量单位不同,不能直接相加的指标,过渡到可以加总和比较而使用的 媒介因素。作用:同度量因素在计算总指数的过程中,对各因素起着权衡轻重的作用,所以也叫权 数。3 .拉氏指数与帕氏指数各有什么特点拉氏指数:在计算综合指数时将作为权数的同度量因素固定在基期。(数量指数)帕氏指数:在计算综合指数时将作为权数的同度量因素固定在报告期。(质量指数)4 .加权平均指数与加权综合指数有何区别与联系加权平均指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 贾俊平 第六 课后 思考题 答案

限制150内