《统计学相关关系与回归(共12页).doc》由会员分享,可在线阅读,更多相关《统计学相关关系与回归(共12页).doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上专心-专注-专业引言.摘要:.Abstract:.相关一、相关关系的概念(1)确定性的函数关系 Y=f (X)(2)不确定性的统计关系相关关系 Y= f(X)+(为随机变量,就是这个不确定的来源)(3)没有关系二、相关关系的描述与测度他要解决的问题是:(学完在回答)(1)变量之间是否存在关系?(2)如果存在关系,他们之间是什么样的关系?(3)变量之间的关系强度如何?(4)样本所反映的变量之间的关系能否代表总体变量之间的关系?在解决这些问题时,进行相关分析,首先要对总体有俩个假定:(1)俩个变量之间是线性关系(否则讨论它干吗)(2)俩个变量都是随机变量(定义)1、从散点
2、图来看相关关系的类型(1)从涉及的变量数量看 简单相关 多重相关(复相关)(2)从变量相关关系的表现形式看线性相关散布图接近一条直线(左图)非线性相关散布图接近一条曲线(右图)(3)从变量相关关系变化的方向看正相关变量同方向变化(同增同减) 负相关变量反方向变化(一增一减) (4)从变量相关的程度看完全相关 不完全相关 不相关 2、相关系数1)总体相关系数对于所研究的总体,表示两个相互联系变量相关程度的总体相关系数为: 总体相关系数反映总体两个变量X和Y的线性相关程度。特点:对于特定的总体来说,X和Y的数值是既定的总体相关系数是客观存在的特定数值。2)样本相关系数通过X和Y 的样本观测值去估计
3、样本相关系数变量X和Y的样本相关系数通常表示: 特点:样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。 三、相关系数的性质1、相关系数的取值在-1与1之间。当r=0时,表明X与Y没有线性相关关系。当时,表明X与Y存在一定的线性相关关系: 若表明X与Y 为正相关; 若表明X与Y 为负相关。当时,表明X与Y完全线性相关: 若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。2、X和Y 都是相互对称的随机变量,所以3、相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。4、相关系数不能确定变量的因果关系,也不能说明相关关系具体接近
4、于哪条直线。5、一个变量的取值不能由另一个变量唯一确定。四、总结 所以在进行相关分析时,首先需要绘制散点图来判断变量之间的关系形态,如果是线性关系,则可以利用相关系数来测度俩个变量之间的关系强度,然后对相关系数进行显著性检验,以判断样本所反映的关系能否代表俩个变量总体上的关系。关系强度:时,高度相关 时,中度相关 时,低度相关 时,可视为不相关最后介绍下 相关性显著性检验简单回归相关分析的目的在与测度变量之间的关系强度,测度工具就是相关系数。而回归分析则侧重于考察变量之间的数量关系,并且通过一定的数学表达式将这种关系描述出来,进而确定一个或几个变量的变化对另一个特定变量的影响程度。一、俩个概念
5、1总体回归函数(PRF)(其中,因变量依赖于自变量和误差项随机)2样本回归函数(SRF) 或者3样本回归函数与总体回归函数的相互区别 1)总体回归函数虽然未知,但它是确定的;样本回归线随抽样波动而变化,可以有许多条。 2)样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。 3)总体回归函数的参数虽未知,但是确定的常数;样本回归函数的参数可估计,但是随抽样而变化的随机变量。 4)总体回归函数中的是不可直接观测的;而样本回归函数中的是只要估计出样本回归的参数就可以计算的数值。二、简单线性回归的基本假定假定1:零均值假定。即。假定2:同方差假定。即。假定3:无自相关假定。即。假定4:误差项与自变量不相关。即。假定5:正态性假定。即。三、参数的最小二乘法基本思想:希望所估计的偏离实际观测值的残差越小越好。可以取残差平方和作为衡量与偏离程度的标准最小二乘准则。则令最小,分别对和求偏导数且令偏导数为0,得四、总结1、共同的研究对象:都是对变量间相关关系的分析。2、只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。3、相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析。4、相关分析中相关系数的确定建立在回归分析的基础上。参考文献
限制150内