欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    一元线性回归基本知识.ppt

    • 资源ID:3705053       资源大小:1.29MB        全文页数:22页
    • 资源格式: PPT        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    一元线性回归基本知识.ppt

    统计思维,回归的直观理解与原理: 一元线性回归,(一)问题的提出,例1 假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。,图1 化肥施用量与粮食产量的散点图,上述变量间关系的特点:,变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围,问题,两个变量之间有着密切的关系,但它们之间密切的程度并不能由一个变量唯一确定另一个变量,即它们间的关系是一种非确定性的关系。它们之间到底有什么样的关系呢? 例1中由20组数据,粮食产量与化肥施用量的关系式 是如何得到的?,解决方案,运用模型来拟合这些数据点。 观测值分解成两部分: y = b0 + b1 x + e 一元线性回归模型,(二)一元线性回归模型,描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型 一元线性回归模型可表示为 y = b0 + b1 x + e y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 0 和 1 称为模型的参数,一元线性回归模型 (基本假定),因变量x与自变量y之间具有线性关系 在重复抽样中,自变量x的取值是固定的,即假定x是非随机的 误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E ( y ) = 0+ 1 x 对于所有的 x 值,的方差2 都相同 误差项是一个服从正态分布的随机变量,且相互独立。即N(0 ,2 ) 独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关 对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关,回归方程 (regression equation),描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 一元线性回归方程的形式如下 E( y ) = 0+ 1 x,方程的图示是一条直线,也称为直线回归方程 0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,x,y,(xn , yn),(x1 , y1),(x2 , y2),(xi , yi),问题:回归直线如何确定?,Karl Gauss的最小化图,x,y,(xn , yn),(x1 , y1),(x2 , y2),(xi , yi),目标:找一条直线尽可能的拟合这n个样本点。,(三)最小二乘估计 (least-squares estimation ),德国科学家Karl Gauss(17771855)提出用最小化图中垂直方向的误差平方和来估计参数 使因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小,问题,如何估计 使得 最小,解决方法,根据微积分法求极值的原理,通过求偏导数并命其为0而得到: 这组方程称为正规方程组 经过整理,可得?,其中, 记 可以简写为,经过整理,可得,例1 假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。,最小二乘法求解回归方程实例,解:,回归方程为:,直观来看,回归直线与20个样本数据点都很接近,说明回归直线对数据的拟合效果是好的。,图1 化肥施用量与粮食产量的散点图,最小二乘估计的软件实现、输出结果,回归方程为:,小结:估计的回归方程,一元线性回归中估计的回归方程为,用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程,总体回归参数 和 是未知的,必须利用样本数据去估计,其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值, 是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 .,“回归”名称的由来,十九世纪,英国生物学家兼统计学家高尔顿研究父母身高与其子女身高的遗传问题时,观察了1078对夫妇,以每对夫妇的平均身高作为x(单位:英寸,1英寸=2.54厘米),取他们的一个成年儿子的身高作为y,绘制散点图发现趋势近乎一条直线,计算出的直线方程为: 这种趋势表明子代的身高向中心回归,才使得人类的身高在一定时间内相对稳定,没有出现两极分化现象。 其后研究变量x和变量y的统计关系时借用这个名词。,

    注意事项

    本文(一元线性回归基本知识.ppt)为本站会员(小**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开