变量间的相关关系与统计案例W.doc
《变量间的相关关系与统计案例W.doc》由会员分享,可在线阅读,更多相关《变量间的相关关系与统计案例W.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、变量间的相关关系与统计案例基础梳理1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,其中,b是回归方程的斜率,a是在y轴上的截距4样本相关系
2、数,用它来衡量两个变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|0.75时,认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2 ,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好6独立性检验(1)用变量的
3、不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:22列联表y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量),可利用独立性检验判断表来判断“x与y的关系”这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验练习:1对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(u
4、i、vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关2(2012南昌模拟)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()y1y2合计x1a2173x2222547合计b46120A.10x200 B.10x200C.10x200 D.10x2003(2012枣庄模拟)下面是22列联表:则表中a,b的值分别为()A94,72 B52,50 C52,74 D74,524. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 相关 关系 统计 案例
限制150内