第4章-回归-分析ppt课件.pptx
《第4章-回归-分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《第4章-回归-分析ppt课件.pptx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高级大数据人才培养丛书之一,大数据挖掘技术与应用王朝霞 主编 施建强 杨慧娟 陈建彪 副主编DATA MINING曹 洁 宁亚辉 王伟嘉 袁晓东 张卫明 编者(按姓氏首字母排序) 刘 鹏 张 燕 总主编数据挖掘第四章回归of592高级大数据人才培养丛书之一,大数据挖掘技术与应用回归是一种基于统计原理,对大量统计数据进行数学处理,并确定变量(或属性)之间的相关关系,建立一个相关性的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的方法。根据因变量和自变量的函数表达式分为:线性回归分析、非线性回归分析。根据因变量和自变量的个数可分为:一元回归分析、多元回归分析、逻辑回归分析和其它回归
2、分析等。More应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。4.1回归基本概念第四章回归4.2一元回归分析4.3多元线性回归分析3.1数据挖掘概述4.5其他回归分析习题4.4逻辑回归分析of593高级大数据人才培养丛书之一,大数据挖掘技术与应用4.6实战:用回归分析方法给自己的房子定价对于社会经济现象,很难确定因变量和自变量之间的关系,因为它们大多是随机的,只有通过大量的观察统计,才能找出其中的规律,随机分析是利用统计学原理描述随机变量关系的一种方法。回归分析可简单理解为信息分析与预测,信息即统计数据,分析即对信息进行数据
3、处理,预测就是加以外推,也就是适当扩大已有自变量取值范围,并承认该回归方程在该扩大的定义域内成立,然后就可以在该定义域上取值进行“未来预测”。当然,对回归方程可以进行有效的控制。因此,回归分析主要解决下面两方面的问题:1) 确定变量之间是否存在相关关系,若存在,则找出数学表达式。2)根据一个或几个变量的值,预测或控制另一个或几个变量的值,且要估计这种控制或预测或以达到何种精确度。4.1.1 回归分析的定义of5944.1回归基本概念第四章 回归4.1.2 回归分析步骤of5954.1回归基本概念第四章 回归为使回归分析方程较能符合实际,首先应尽可能判断自变量的可能种类和个数,并在观察事物发展规
4、律的基础上定性回归方程的可能类型;其次,力求掌握较充分的高质量统计数据,再运用统计方法,利用数学工具和相关软件,从定量方面计算或改进定性判断。4.1.2 回归分析要注意的问题of5964.1回归基本概念第四章 回归4.1回归基本概念第四章回归4.2一元回归分析4.3多元线性回归分析3.1数据挖掘概述4.5其他回归分析习题4.4逻辑回归分析of597高级大数据人才培养丛书之一,大数据挖掘技术与应用4.6实战:用回归分析方法给自己的房子定价4.2.1 一元回归分析的模型设定of5984.2一元回归分析第四章 回归4.2.1 一元回归分析的模型设定of5994.2一元回归分析第四章 回归在进行消费行
5、为研究中,从一个地区抽取20 个不同家庭的月可支配收入和消费数据,如下表所示:例4.1of59104.2一元回归分析第四章 回归序号序号 消费(百元)消费(百元)可支配收入(百元)可支配收入(百元)序号序号 消费(百元)消费(百元)可支配收入(百元)可支配收入(百元)172.310011132.3189292.5112012149.82143135.220013115.318849413014132.21975163.524015149.5206610011416100.25142786.51261779.61128142.362131890.2134912015619116.51691011
6、2.5616720126170以可支配收入为横轴、消费为纵轴画出样本数据的散点图例4.1of59114.2一元回归分析第四章 回归从图中可以看出,可支配收入和消费之间存在明显的线性关系。但所有点并不在一条直线上,表明二者之间的关系是一种随机关系。4.2.1 一元回归分析的模型设定of59124.2一元回归分析第四章 回归4.2.2 一元线性回归模型的参数估计of59134.2一元回归分析第四章 回归4.2.3 基本假设下OLS估计的统计性质of59144.2一元回归分析第四章 回归4.2.3 基本假设下OLS估计的统计性质of59154.2一元回归分析第四章 回归(4.4)4.2.4 误差方差
7、估计of59164.2一元回归分析第四章 回归4.2.6 拟合优度和模型检验(F 检验)of59174.2一元回归分析第四章 回归4.1回归基本概念第四章回归4.2一元回归分析4.3多元线性回归分析3.1数据挖掘概述4.5其他回归分析习题4.4逻辑回归分析of5918高级大数据人才培养丛书之一,大数据挖掘技术与应用4.6实战:用回归分析方法给自己的房子定价多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。多元回归分析可以达到以下目的:1. 了解因变量和自变量之间的关系是否存在,以及这
8、种关系的强度。也就是以自变量所解释的因变量的变异部分是否显著,且因变量变异中有多大部分可以由自变量来解释。2. 估计回归方程,求在自变量已知的情况下因变量的理论值或预测值 ,达到预测目的。3. 评价特定自变量对因变量的贡献,也就是在控制其他自变量不变的情况下,该处变量的变化所导致的因变量变化情况。4. 比较各处变量在拟合的回归方程中相对作用大小,寻找最重要的和比较重要的自变量。4.3.1多元线性回归模型of59194.3多元线性回归分析第四章 回归4.3.1多元线性回归模型of59204.3多元线性回归分析第四章 回归建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注
9、意自变量的选择,其准则是: 1. 自变量对因变量必须有显著的影响,并呈密切的线性相关;2. 自变量与因变量之间的线性相关必须是真实的,而不是形式上的; 3. 自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度; 4. 自变量应具有完整的统计数据,其预测值容易确定。4.3.1多元线性回归模型of59214.3多元线性回归分析第四章 回归4.3.2 多元线性回归模型的假定of59224.3多元线性回归分析第四章 回归4.3.3 多元线性回归模型的参数估计of59234.3多元线性回归分析第四章 回归4.3.3 多元线性回归模型的参数估计of59244.3多元线
10、性回归分析第四章 回归4.3.3 多元线性回归模型的参数估计of59254.3多元线性回归分析第四章 回归3.估计参数的统计性质(1)线性性(2)无偏性(3)最小方差性4.3.3 多元线性回归模型的参数估计of59264.3多元线性回归分析第四章 回归4.3.4 显著性检验of59274.3多元线性回归分析第四章 回归1. 变量选择问题选择合适的变量用于建立一个“最优”的回归方程(1)逐步回归法(Stepwise)(2)向前引入法(Forward)(3)向后剔除法(Backward)。4.3.4 回归变量的选择与逐步回归of59284.3多元线性回归分析第四章 回归2. 逐步回归分析(1)基本
11、思想逐个引入自变量。每次引入对影响最显著的自变量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中既不漏掉对影响显著的变量,又不包含对影响不显著的变量。4.3.4 回归变量的选择与逐步回归of59294.3多元线性回归分析第四章 回归2. 逐步回归分析(2)筛选的步骤从回归方程中考虑剔除不显著变量。从不在方程中的变量考虑引入新变量。4.3.4 回归变量的选择与逐步回归of59304.3多元线性回归分析第四章 回归4.1回归基本概念第四章回归4.2一元回归分析4.3多元线性回归分析3.1数据挖掘概述4.5其他回归分析习题4.4逻辑回归分析of5931高级大数
12、据人才培养丛书之一,大数据挖掘技术与应用4.6实战:用回归分析方法给自己的房子定价4.4.2 logit变换of59324.4逻辑回归分析第四章 回归4.4.3 Logistic分布of59334.4逻辑回归分析第四章 回归4.4.4 列连表的Logistic回归模型of59344.4逻辑回归分析第四章 回归4.4.4 列连表的Logistic回归模型of59354.4逻辑回归分析第四章 回归4.1回归基本概念第四章回归4.2一元回归分析4.3多元线性回归分析3.1数据挖掘概述4.5其他回归分析习题4.4逻辑回归分析of5936高级大数据人才培养丛书之一,大数据挖掘技术与应用4.6实战:用回归
13、分析方法给自己的房子定价对于一个回归方程,如果自变量的指数大于1,那么它就是多项式回归方程。如果自变量只有一个时,称为一元多项式回归;如果自变量有多个时,称为多元多项式回归。在一元回归分析中,如果依变量y与自变量x的关系为非线性的,但是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归。在这种回归技术中,最佳拟合线不是直线。而是一个用于拟合数据点的曲线。多项式回归的最大优点就是可以通过增加x的高次项对实测点进行逼近,直至满意为止。事实上,多项式回归可以处理相当一类非线性问题,它在回归分析中占有重要的地位,因为任一函数都可以分段用多项式来逼近。因此,在通常的实际问题中,不论依变量与其他自变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 ppt 课件
限制150内