欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    初步回归分析培训资料.pptx

    • 资源ID:78681075       资源大小:1.47MB        全文页数:31页
    • 资源格式: PPTX        下载积分:9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    初步回归分析培训资料.pptx

    回归分析(fnx)初步二二二二OOOOOOOO四年二月四年二月四年二月四年二月(r yu)(r yu)(r yu)(r yu)二十五日二十五日二十五日二十五日培训资料培训资料培训资料培训资料1第一页,共31页。目的:目的:目的:目的:介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有(jyu)(jyu)(jyu)(jyu)连续响应变量连续响应变量连续响应变量连续响应变量“Y“Y“Y“Y 的过程的过程的过程的过程定义:定义:定义:定义:实证实证实证实证基于观测值或事实基于观测值或事实基于观测值或事实基于观测值或事实目标:目标:目标:目标:确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用理解使用回归方法构建一个连续理解使用回归方法构建一个连续理解使用回归方法构建一个连续理解使用回归方法构建一个连续“X“X“X“X变量变量变量变量(binling)(binling)(binling)(binling)与连续与连续与连续与连续“Y“Y“Y“Y响应变量响应变量响应变量响应变量(binling)(binling)(binling)(binling)的关系模型的关系模型的关系模型的关系模型在在在在MinitabMinitabMinitabMinitab中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定X X X X的情况下,用拟合的情况下,用拟合的情况下,用拟合的情况下,用拟合的直线方程式预测的直线方程式预测的直线方程式预测的直线方程式预测“Y“Y“Y“Y了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法单变量单变量(binling)(binling)回归回归2第二页,共31页。什么是回归?什么是回归?什么是回归?什么是回归?描述描述描述描述(mio sh)“Y(mio sh)“Y(mio sh)“Y(mio sh)“Y与与与与“X“X“X“X关系的数学方法关系的数学方法关系的数学方法关系的数学方法 创立工序的创立工序的创立工序的创立工序的“模型模型模型模型Y=b0+b1x+e Y=b0+b1x+e Y=b0+b1x+e Y=b0+b1x+e 其中:其中:其中:其中:b0b0b0b0为为为为Y Y Y Y截距截距截距截距b1b1b1b1为直线斜率为直线斜率为直线斜率为直线斜率e e e e为模型的误差项为模型的误差项为模型的误差项为模型的误差项为何要使用回归?为何要使用回归?为何要使用回归?为何要使用回归?寻找潜在的关键少数寻找潜在的关键少数寻找潜在的关键少数寻找潜在的关键少数“X“X“X“X 预测预测预测预测“Y“Y“Y“Y 优化优化优化优化“Y“Y“Y“Y 确定如何设置确定如何设置确定如何设置确定如何设置“X“X“X“X以优化以优化以优化以优化“Y“Y“Y“Y何时使用回归?何时使用回归?何时使用回归?何时使用回归?筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键“X“X“X“X危险危险危险危险!不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行DOEDOEDOEDOE试验设计试验设计试验设计试验设计记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系当前可能并不存在当前可能并不存在当前可能并不存在当前可能并不存在 分析分析分析分析DOEDOEDOEDOE试验设计的结果试验设计的结果试验设计的结果试验设计的结果回归回归(hugu)(hugu)寻找寻找“Y“Y与与“X“X关系的方法关系的方法回归是一种必须谨慎回归是一种必须谨慎回归是一种必须谨慎回归是一种必须谨慎(jnshn)(jnshn)(jnshn)(jnshn)使用的强有力的工具使用的强有力的工具使用的强有力的工具使用的强有力的工具3第三页,共31页。单变量单变量(binling)(binling)回归回归我们可能对独立变量我们可能对独立变量我们可能对独立变量我们可能对独立变量X X X X和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示(biosh)(biosh)(biosh)(biosh)它们之间关系的散它们之间关系的散它们之间关系的散它们之间关系的散点图可能如下所示:点图可能如下所示:点图可能如下所示:点图可能如下所示:假定真正的关系假定真正的关系假定真正的关系假定真正的关系(gun x)(gun x)(gun x)(gun x)为:为:为:为:线性关系线性关系线性关系线性关系(gun x)(gun x)(gun x)(gun x)存在存在存在存在“b0“b0“b0“b0常数和常数和常数和常数和“b1“b1“b1“b1系数为固定、但未知的参数系数为固定、但未知的参数系数为固定、但未知的参数系数为固定、但未知的参数“X“X“X“X 为独立变量为独立变量为独立变量为独立变量“Y“Y“Y“Y 为观测的响应值为观测的响应值为观测的响应值为观测的响应值“e“e“e“e 为误差。常见的误差假设有:为误差。常见的误差假设有:为误差。常见的误差假设有:为误差。常见的误差假设有:平均值为平均值为平均值为平均值为0.00.00.00.0不相关不相关不相关不相关正态分布正态分布正态分布正态分布误差不存在型式的分布误差不存在型式的分布误差不存在型式的分布误差不存在型式的分布Y Y Y Yi i i i =b b b bo o o o +b +b +b +b1 1 1 1 *X *X *X *Xi i i i+e e e ei i i i4第四页,共31页。收集数据收集数据收集数据收集数据 以估测方程以估测方程以估测方程以估测方程(fngchng)(fngchng)(fngchng)(fngchng)的最正确方法是什么?的最正确方法是什么?的最正确方法是什么?的最正确方法是什么?“b0“b0“b0“b0和和和和“b1“b1“b1“b1的估测值是多少的估测值是多少的估测值是多少的估测值是多少(dusho)(dusho)(dusho)(dusho)?这是否是正确这是否是正确这是否是正确这是否是正确(zhngqu)(zhngqu)(zhngqu)(zhngqu)的函数形式直线?的函数形式直线?的函数形式直线?的函数形式直线?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?误差误差误差误差“ei“ei“ei“ei有多大?有多大?有多大?有多大?与拟合方程相关的问题有:与拟合方程相关的问题有:5第五页,共31页。收集收集(shuj)(shuj)数据数据要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,将观测值的1/21/21/21/2置于置于置于置于“X“X“X“X的下限,将其它的下限,将其它的下限,将其它的下限,将其它1/21/21/21/2置于上限,置于上限,置于上限,置于上限,并使独立变量在广范围内取值并使独立变量在广范围内取值并使独立变量在广范围内取值并使独立变量在广范围内取值这适用于这适用于这适用于这适用于Y Y Y Y值高度值高度值高度值高度(god)(god)(god)(god)变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为直线的情形直线的情形直线的情形直线的情形-1-1-1-11 1 1 1x x x xy y y y要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,采用两级以上的独立变量。如果采用两级以上的独立变量。如果采用两级以上的独立变量。如果采用两级以上的独立变量。如果(rgu)(rgu)(rgu)(rgu)数数数数据高度变化,常常采用据高度变化,常常采用据高度变化,常常采用据高度变化,常常采用3 3 3 3个级别个级别个级别个级别-1-1-1-11 1 1 1x x x xy y y y0 0 0 0最好是以随机顺序收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的“X“X“X“X开始然后逐渐递增开始然后逐渐递增开始然后逐渐递增开始然后逐渐递增 另一个随时另一个随时另一个随时另一个随时间变化的可能影响工序间变化的可能影响工序间变化的可能影响工序间变化的可能影响工序6第六页,共31页。MinitabMinitab的单变量的单变量(binling)(binling)回归回归在在在在MinitabMinitabMinitabMinitab中翻开新工作表,并在中翻开新工作表,并在中翻开新工作表,并在中翻开新工作表,并在C1C1C1C1和和和和C2C2C2C2中输入中输入中输入中输入(shr)(shr)(shr)(shr)以下数据:以下数据:以下数据:以下数据:举例举例举例举例(j l):(j l):(j l):(j l):您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下数据证明这种关系的存在数据证明这种关系的存在数据证明这种关系的存在数据证明这种关系的存在7第七页,共31页。看上去是线性看上去是线性看上去是线性看上去是线性!1)1)始终首先将数据始终首先将数据(shj)(shj)制图制图GraphPlotGraphPlotGraphPlotGraphPlot单击单击单击单击“OK“OK“OK“OK 运行运行运行运行(ynxng)(ynxng)(ynxng)(ynxng)8第八页,共31页。2)2)运行数据的回归运行数据的回归(hugu)(hugu)分析分析自变量自变量自变量自变量单击单击单击单击 Graphs Graphs Graphs Graphs 单击单击单击单击 Storage Storage Storage Storage StatRegressionRegression.StatRegressionRegression.StatRegressionRegression.StatRegressionRegression.(参见参见参见参见(cnjin)(cnjin)(cnjin)(cnjin)下页的子对话框下页的子对话框下页的子对话框下页的子对话框 并并并并9第九页,共31页。此对话框用于生成此对话框用于生成此对话框用于生成此对话框用于生成(shn(shn(shn(shn chn)chn)chn)chn)残差残差残差残差(误差误差误差误差)图图图图采用这些图形检验您的模型采用这些图形检验您的模型采用这些图形检验您的模型采用这些图形检验您的模型中有关误差的假设中有关误差的假设中有关误差的假设中有关误差的假设单击此框,指明您想看的图形单击此框,指明您想看的图形单击此框,指明您想看的图形单击此框,指明您想看的图形单击单击单击单击OK,OK,OK,OK,然后然后然后然后(rnhu)(rnhu)(rnhu)(rnhu)单击对话框中的单击对话框中的单击对话框中的单击对话框中的 Storage Storage Storage Storage 按钮按钮按钮按钮单击单击单击单击Fits Fits Fits Fits 和和和和 Residuals Residuals Residuals Residuals,以在数据窗,以在数据窗,以在数据窗,以在数据窗口存储口存储口存储口存储(cn ch)(cn ch)(cn ch)(cn ch)信息信息信息信息点击点击点击点击 OKOKOKOK 两次两次两次两次10第十页,共31页。“X“X“X“X 变量变量变量变量(binling)(binling)(binling)(binling)的的的的p p p p值值值值-速度速度速度速度 Ho:Ho:Ho:Ho:斜率斜率斜率斜率=0=0=0=0 Ha:Ha:Ha:Ha:斜率斜率斜率斜率=0=0=0=0或者,另一种表达方式:或者,另一种表达方式:或者,另一种表达方式:或者,另一种表达方式:Ho:“X Ho:“X Ho:“X Ho:“X 不显著不显著不显著不显著 Ha:“X Ha:“X Ha:“X Ha:“X 显著显著显著显著会话窗口包含会话窗口包含(bohn)(bohn)分析结果分析结果.关于会话窗口输出结果关于会话窗口输出结果关于会话窗口输出结果关于会话窗口输出结果(ji gu)(ji gu)(ji gu)(ji gu)的进一步描述,可参见附录的进一步描述,可参见附录的进一步描述,可参见附录的进一步描述,可参见附录接受接受接受接受HHHHa a a a无法拒绝无法拒绝无法拒绝无法拒绝HHHHo o o o“Ctrl-M”Ctrl-M”Ctrl-M”Ctrl-M”移至会话窗口移至会话窗口移至会话窗口移至会话窗口常数常数常数常数的的的的p-p-p-p-值值值值HHHH0 0 0 0:直线通过原点直线通过原点直线通过原点直线通过原点(0,0)(0,0)(0,0)(0,0)(0(0(0(0速度速度速度速度=0=0=0=0蒸发蒸发蒸发蒸发)H HH Ha a a a:直线不通过原点直线不通过原点直线不通过原点直线不通过原点(0,0)(0,0)(0,0)(0,0)11第十一页,共31页。s:s:s:s:残差残差残差残差(误差误差误差误差)的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离(对于优秀的模型,此值应较对于优秀的模型,此值应较对于优秀的模型,此值应较对于优秀的模型,此值应较小小小小)s=MS(error)1/2s=MS(error)1/2s=MS(error)1/2s=MS(error)1/2R-Sq:R-Sq:R-Sq:R-Sq:由拟合线由拟合线由拟合线由拟合线“解释的总变差的百分数。由解释的总变差的百分数。由解释的总变差的百分数。由解释的总变差的百分数。由“X“X“X“X解释的变差。解释的变差。解释的变差。解释的变差。(对于优秀的模型,此值应较大对于优秀的模型,此值应较大对于优秀的模型,此值应较大对于优秀的模型,此值应较大(jio d)(jio d)(jio d)(jio d)R-Sq(adj):R-Sq(adj):R-Sq(adj):R-Sq(adj):对过于拟合情况对过于拟合情况对过于拟合情况对过于拟合情况(方程式中的变量过多方程式中的变量过多方程式中的变量过多方程式中的变量过多)的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个数进行比照其中其中其中其中 n=n=n=n=观测值数量观测值数量观测值数量观测值数量 p=p=p=p=模型中项数,包括常数模型中项数,包括常数模型中项数,包括常数模型中项数,包括常数请参见附录请参见附录请参见附录请参见附录(fl)(fl)(fl)(fl)更多的定义更多的定义更多的定义更多的定义R R R R2 2 2 2越大,模型对工序模拟得越好越大,模型对工序模拟得越好越大,模型对工序模拟得越好越大,模型对工序模拟得越好对于良好的模型,该值对于良好的模型,该值对于良好的模型,该值对于良好的模型,该值应接近应接近应接近应接近R R R R2 2 2 2值值值值该值越小该值越小该值越小该值越小(误差的大小误差的大小误差的大小误差的大小),模型越好模型越好模型越好模型越好R R2 2=SS=SSregressionregressionSSSStotaltotal12第十二页,共31页。通过查看通过查看通过查看通过查看(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj),s s s s和和和和p p p p值值值值来评估模型来评估模型来评估模型来评估模型SSregression:SSregression:由模型中的由模型中的由模型中的由模型中的“X“X而解释的响应变量而解释的响应变量而解释的响应变量而解释的响应变量(binling)“Y(binling)“Y的变差;每一的变差;每一的变差;每一的变差;每一X X值对应的模型预测值和值对应的模型预测值和值对应的模型预测值和值对应的模型预测值和Y Y的总平均值之差的平方和的总平均值之差的平方和的总平均值之差的平方和的总平均值之差的平方和SSerror:SSerror:未被解释的未被解释的未被解释的未被解释的“Y“Y的变差;每个数据点的的变差;每个数据点的的变差;每个数据点的的变差;每个数据点的Y Y观测值和该数据点观测值和该数据点观测值和该数据点观测值和该数据点Y Y的预测值之差的平方和的预测值之差的平方和的预测值之差的平方和的预测值之差的平方和SStotal:YSStotal:Y值相对其平均值的总变差值相对其平均值的总变差值相对其平均值的总变差值相对其平均值的总变差误差项相对总数应很小误差项相对总数应很小误差项相对总数应很小误差项相对总数应很小p-p-p-p-值应值应值应值应 0.05 0.05 0.05 RegressionFitted Line PlotStatRegressionFitted Line PlotStatRegressionFitted Line PlotStatRegressionFitted Line Plot单击这些选项以在单击这些选项以在单击这些选项以在单击这些选项以在图形输出窗口图形输出窗口图形输出窗口图形输出窗口(chungku)(chungku)(chungku)(chungku)显示更多的显示更多的显示更多的显示更多的信息信息信息信息“拟合线图提供:拟合线图提供:拟合线图提供:拟合线图提供:会话窗口中的回归分析会话窗口中的回归分析会话窗口中的回归分析会话窗口中的回归分析显示运用最小二乘法原理显示运用最小二乘法原理显示运用最小二乘法原理显示运用最小二乘法原理(yunl)(yunl)(yunl)(yunl)拟合直线拟合直线拟合直线拟合直线*图图图图显示置信区间显示置信区间显示置信区间显示置信区间(C.I.)(C.I.)(C.I.)(C.I.)和预测区间和预测区间和预测区间和预测区间(P.I.)(P.I.)(P.I.)(P.I.)图图图图单击两次单击两次单击两次单击两次“OK“OK“OK“OK*参见附录中的最小二乘法参见附录中的最小二乘法参见附录中的最小二乘法参见附录中的最小二乘法单击单击单击单击“Options“Options“Options“Options18第十八页,共31页。置信区间和预测置信区间和预测(yc)(yc)区间区间C.I.=C.I.=C.I.=C.I.=置信区间置信区间置信区间置信区间(95%(95%(95%(95%置信度表示所有数据的平均值都位于此带内置信度表示所有数据的平均值都位于此带内置信度表示所有数据的平均值都位于此带内置信度表示所有数据的平均值都位于此带内)P.I.=P.I.=P.I.=P.I.=预测预测预测预测(yc)(yc)(yc)(yc)区间区间区间区间(95%(95%(95%(95%置信度表示单个数据点位于此带内置信度表示单个数据点位于此带内置信度表示单个数据点位于此带内置信度表示单个数据点位于此带内)置信置信置信置信(zhxn)(zhxn)(zhxn)(zhxn)带带带带预测带预测带预测带预测带 19第十九页,共31页。会话窗口中的信息会话窗口中的信息(xnx)(xnx)与早期生成的信息与早期生成的信息(xnx)(xnx)相同相同无法无法无法无法(wf)(wf)(wf)(wf)否认否认否认否认Ho:Ho:Ho:Ho:接受接受接受接受(jishu)Ha:(jishu)Ha:(jishu)Ha:(jishu)Ha:结论:结论:结论:结论:我们已经找到潜在的关键我们已经找到潜在的关键我们已经找到潜在的关键我们已经找到潜在的关键“X“X“X“X 速度速度速度速度根据散点图、及残差图无型态得出结论,线性模型拟合良好根据散点图、及残差图无型态得出结论,线性模型拟合良好根据散点图、及残差图无型态得出结论,线性模型拟合良好根据散点图、及残差图无型态得出结论,线性模型拟合良好拟合有多好?拟合有多好?拟合有多好?拟合有多好?给定速度来预测蒸发率,为此目的,这个模型应该可以接受给定速度来预测蒸发率,为此目的,这个模型应该可以接受给定速度来预测蒸发率,为此目的,这个模型应该可以接受给定速度来预测蒸发率,为此目的,这个模型应该可以接受(基于:基于:基于:基于:R2=90.5%R2=90.5%R2=90.5%R2=90.5%,以及较小误差项,以及较小误差项,以及较小误差项,以及较小误差项(S=.16)(S=.16)(S=.16)(S=.16)如果工序非常关键,应使用更多的数据。然后,可以建立误差分布更接近正态的回归模型如果工序非常关键,应使用更多的数据。然后,可以建立误差分布更接近正态的回归模型如果工序非常关键,应使用更多的数据。然后,可以建立误差分布更接近正态的回归模型如果工序非常关键,应使用更多的数据。然后,可以建立误差分布更接近正态的回归模型20第二十页,共31页。课堂练习课堂练习:您相信我们的家电所占据的展示厅面积的大小会影响销售量。您已经收集了过去您相信我们的家电所占据的展示厅面积的大小会影响销售量。您已经收集了过去您相信我们的家电所占据的展示厅面积的大小会影响销售量。您已经收集了过去您相信我们的家电所占据的展示厅面积的大小会影响销售量。您已经收集了过去12121212个月内,多个零个月内,多个零个月内,多个零个月内,多个零售点销售量与总的占地面积方面的数据售点销售量与总的占地面积方面的数据售点销售量与总的占地面积方面的数据售点销售量与总的占地面积方面的数据(shj)(shj)(shj)(shj)。现在,您希望分析这些数据。现在,您希望分析这些数据。现在,您希望分析这些数据。现在,您希望分析这些数据(shj)(shj)(shj)(shj),看占地面积是,看占地面积是,看占地面积是,看占地面积是否确实与年销售量存在某种关系否确实与年销售量存在某种关系否确实与年销售量存在某种关系否确实与年销售量存在某种关系在在在在MinitabMinitabMinitabMinitab输入输入输入输入(shr)(shr)(shr)(shr)以下数据:以下数据:以下数据:以下数据:应用您所学的单变量回归方法应用您所学的单变量回归方法应用您所学的单变量回归方法应用您所学的单变量回归方法(fngf)(fngf)(fngf)(fngf)。准备好解释您的答案、以及支持您的结论的结。准备好解释您的答案、以及支持您的结论的结。准备好解释您的答案、以及支持您的结论的结。准备好解释您的答案、以及支持您的结论的结果果果果 ($($($($K)(K)(K)(K)(平方英尺平方英尺平方英尺平方英尺)21第二十一页,共31页。关键关键(gunjin)(gunjin)概念概念 在进行回归之前,将在进行回归之前,将在进行回归之前,将在进行回归之前,将“Y“Y“Y“Y与与与与“X“X“X“X的数据画图您首先需要知道哪种模型适的数据画图您首先需要知道哪种模型适的数据画图您首先需要知道哪种模型适的数据画图您首先需要知道哪种模型适宜宜宜宜(shy)(shy)(shy)(shy)回归可用于被动数据,但一定要谨慎,因为它不是一个受到控制的试验回归可用于被动数据,但一定要谨慎,因为它不是一个受到控制的试验回归可用于被动数据,但一定要谨慎,因为它不是一个受到控制的试验回归可用于被动数据,但一定要谨慎,因为它不是一个受到控制的试验 在采用回归方法得出有关被动数据的结论之前,一定要进行在采用回归方法得出有关被动数据的结论之前,一定要进行在采用回归方法得出有关被动数据的结论之前,一定要进行在采用回归方法得出有关被动数据的结论之前,一定要进行 DOE DOE DOE DOE 观察观察观察观察残差与拟合值残差与拟合值残差与拟合值残差与拟合值图,以集中精力于您的模型可能存在的潜在问题。借图,以集中精力于您的模型可能存在的潜在问题。借图,以集中精力于您的模型可能存在的潜在问题。借图,以集中精力于您的模型可能存在的潜在问题。借助残差图来判断助残差图来判断助残差图来判断助残差图来判断“拟合的优劣拟合的优劣拟合的优劣拟合的优劣 采用拟合线图,通过数据创立一个回归线图形,并确定模型的置信区间和预采用拟合线图,通过数据创立一个回归线图形,并确定模型的置信区间和预采用拟合线图,通过数据创立一个回归线图形,并确定模型的置信区间和预采用拟合线图,通过数据创立一个回归线图形,并确定模型的置信区间和预测区间测区间测区间测区间22第二十二页,共31页。附录附录(fl)23第二十三页,共31页。回归回归(hugu)(hugu)术语术语 r r r r:多重回归的相关系数多重回归的相关系数多重回归的相关系数多重回归的相关系数(r)(r)(r)(r)。越接近。越接近。越接近。越接近+/-1+/-1+/-1+/-1,模型拟合越好;,模型拟合越好;,模型拟合越好;,模型拟合越好;0000表示无线性关系表示无线性关系表示无线性关系表示无线性关系R-SqR-SqR-SqR-Sq:相关系数的平方相关系数的平方相关系数的平方相关系数的平方(R2)(R2)(R2)(R2)。R2R2R2R2的值越接近的值越接近的值越接近的值越接近100%100%100%100%,说明可能存在关系,由模型解释的变差的百分比越高,说明可能存在关系,由模型解释的变差的百分比越高,说明可能存在关系,由模型解释的变差的百分比越高,说明可能存在关系,由模型解释的变差的百分比越高R-Sq(Adj)R-Sq(Adj)R-Sq(Adj)R-Sq(Adj):在过度拟合情况下对:在过度拟合情况下对:在过度拟合情况下对:在过度拟合情况下对R2R2R2R2的调整的调整的调整的调整(将模型中的项数考虑在内将模型中的项数考虑在内将模型中的项数考虑在内将模型中的项数考虑在内)估计值的估计值的估计值的估计值的数据相对预测数据相对预测数据相对预测数据相对预测“外表的标准变差外表的标准变差外表的标准变差外表的标准变差标准误差标准误差标准误差标准误差s=MSs=MSs=MSs=MS误差误差误差误差1/21/21/21/2回归均方回归均方回归均方回归均方模型总体模型总体模型总体模型总体“之间变差的估测。之间变差的估测。之间变差的估测。之间变差的估测。(MS(MS(MS(MS回归回归回归回归)MSMSMSMS回归回归回归回归=SS=SS=SS=SS回归回归回归回归/DF/DF/DF/DF回归回归回归回归 (DF=(DF=(DF=(DF=自由度自由度自由度自由度)F-F-F-F-比率:比率:比率:比率:“F“F“F“F统计量。数值大表示模型可鉴别因素统计量。数值大表示模型可鉴别因素统计量。数值大表示模型可鉴别因素统计量。数值大表示模型可鉴别因素X X X X与因变量与因变量与因变量与因变量Y Y Y Y值之间的关系值之间的关系值之间的关系值之间的关系F=MSF=MSF=MSF=MS回归回归回归回归/MS/MS/MS/MS误差误差误差误差p-p-p-p-值:值:值:值:接受接受接受接受“存在差异时,发生错误的机率存在差异时,发生错误的机率存在差异时,发生错误的机率存在差异时,发生错误的机率p p p p值值值值0.050.050.050.050.050.050.05说明无法说明无法说明无法说明无法(wf)(wf)(wf)(wf)得出存在差异得出存在差异得出存在差异得出存在差异(显著显著显著显著)的结论的结论的结论的结论模型不是模型不是模型不是模型不是“好模型的机率好模型的机率好模型的机率好模型的机率“好说明找到了因素好说明找到了因素好说明找到了因素好说明找到了因素X X X X与响应变量与响应变量与响应变量与响应变量Y Y Y Y之间的关系之间的关系之间的关系之间的关系24第二十四页,共31页。回归回归(hugu)(hugu)术语术语(续续)和和和和 经常用于表示经常用于表示经常用于表示经常用于表示(biosh)(biosh)(biosh)(biosh)总体值。总体值。总体值。总体值。“b0“b0“b0“b0“b1“b1“b1“b1是从数据中得出的总体值是从数据中得出的总体值是从数据中得出的总体值是从数据中得出的总体值 选择选择选择选择(xunz)“b0(xunz)“b0(xunz)“b0(xunz)“b0“b1“b1“b1“b1,使误差平方和为最小,使误差平方和为最小,使误差平方和为最小,使误差平方和为最小“最小平方:最小平方:最小平方:最小平方:取与取与取与取与“b0“b0“b0“b0和和和和“b1“b1“b1“b1相关的偏导数,并使导数为相关的偏导数,并使导数为相关的偏导数,并使导数为相关的偏导数,并使导数为0.00.00.00.0最小化:最小化:最小化:最小化:(e e e ei i i i2 2 2 2)=)=)=)=(Y(Y(Y(Yi i i i-b-b-b-b0 0 0 0-b-b-b-b1 1 1 1 Xi)Xi)Xi)Xi)2 2 2 2-Y)=bY)=bY)=bY)=b1 1 1 1(X(X(X(X最小平方线通过最小平方线通过最小平方线通过最小平方线通过(X,Y):(YX,Y):(YX,Y):(YX,Y):(Yi i i ii i i i-X)X)X)X)斜率为斜率为斜率为斜率为 b b b b1 1 1 1=-=-=-=-=-(X X X Xi i i i -n X n X n X n X -X)X)X)X)-Y)Y)Y)Y)-X)(YX)(YX)(YX)(Y -n X Yn X Yn X Yn X YX X X X Y Y Y Yi i i ii i i i(X X X Xi i i ii i i i X X X Xi i i i 2 2 2 22 2 2 2 2 2 2 225第二十五页,共31页。计算计算(j sun)(j sun)系数的置信区间系数的置信区间(斜率斜率)(参考参考参考参考(cnko)7.11(cnko)7.11(cnko)7.11(cnko)7.11页的例子页的例子页的例子页的例子)会话窗口中的回归方程式为:蒸发会话窗口中的回归方程式为:蒸发会话窗口中的回归方程式为:蒸发会话窗口中的回归方程式为:蒸发(zhngf)(zhngf)(zhngf)(zhngf)率率率率=0.069+0.00383 =0.069+0.00383 =0.069+0.00383 =0.069+0.00383 速度速度速度速度斜率斜率斜率斜率估算值估算值估算值估算值0.003830.003830.003830.00383为根据数据得出的直线斜率估测值。由于它是估测值,我们知道实际值位于可能为根据数据得出的直线斜率估测值。由于它是估测值,我们知道实际值位于可能为根据数据得出的直线斜率估测值。由于它是估测值,我们知道实际值位于可能为根据数据得出的直线斜率估测值。由于它是估测值,我们知道实际值位于可能取值的范围内取值的范围内取值的范围内取值的范围内-置信区间。斜率的置信区间可根据以下方程式计算:置信区间。斜率的置信区间可根据以下方程式计算:置信区间。斜率的置信区间可根据以下方程式计算:置信区间。斜率的置信区间可根据以下方程式计算:估算值估算值估算值估算值+/-(t df,+/-(t df,+/-(t df,+/-(t df,)()()()(估计值的标准误差估计值的标准误差估计值的标准误差估计值的标准误差)斜率估计值标准误差在斜率估计值标准误差在斜率估计值标准误差在斜率估计值标准误差在StDevStDevStDevStDev栏中查找:栏中查找:栏中查找:栏中查找:0.00044(0.00044(0.00044(0.00044(上舍入上舍入上舍入上舍入)t t t t值是使用模型中误差项的自由度值是使用模型中误差项的自由度值是使用模型中误差项的自由度值是使用模型中误差项的自由度(8)(8)(8)(8)以及双边检验的以及双边检验的以及双边检验的以及双边检验的a a a a0.050.050.050.05而从而从而从而从T T T T表中获得的结果:表中获得的结果:表中获得的结果:表中获得的结果:t=2.31t=2.31t=2.31t=2.31斜率的斜率的斜率的斜率的95%95%95%95%置信区间是置信区间是置信区间是置信区间是 :0.00383+/-2.31(0.00044)0.00383+/-2.31(0.00044)0.00383+/-2.31(0.00044)0.00383+/-2.31(0.00044)(0.00281,0.00485)(0.00281,0.00485)(0.00281,0.00485)(0.00281,0.00485)26第二十六页,共31页。课堂练习答案课堂练习答案(d n)(d n)首先将数据首先将数据首先将数据首先将数据(shj)(shj)(shj)(shj)制图制图制图制图.GraphPlot.GraphPlot.GraphPlot.GraphPlot占地面积和年销售量看上去呈线性关系占地面积和年销售量看上去呈线性关系占地面积和年销售量看上去呈线性关系占地面积和年销售量看上去呈线性关系下一步,运行回归功能下一步,运行回归功能下一步,运行回归功能下一步,运行回归功能(gngnng)(gngnng)(gngnng)(gngnng)得到模拟方程式得到模拟方程式得到模拟方程式得到模拟方程式不要忘记保存残差并创立残差图不要忘记保存残差并创立残差图不要忘记保存残差并创立残差图不要忘记保存残差并创立残差图27第二十七页,共31页。这里这里这里这里“R-Sq“R-Sq“R-Sq“R-Sq的大小对于这两种变量之间的关系大概可以接受的大小对于这两种变量之间的关系大概可以接受的大小对于这两种变量之间的关系大概可以接受的大小对于这两种变量之间的关系大概可以接受(商业质量商业质量商业质量商业质量过程具有大量无法控制的过程具有大量无法控制的过程具有大量无法控制的

    注意事项

    本文(初步回归分析培训资料.pptx)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开