初步回归分析培训资料.pptx
《初步回归分析培训资料.pptx》由会员分享,可在线阅读,更多相关《初步回归分析培训资料.pptx(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归分析(fnx)初步二二二二OOOOOOOO四年二月四年二月四年二月四年二月(r yu)(r yu)(r yu)(r yu)二十五日二十五日二十五日二十五日培训资料培训资料培训资料培训资料1第一页,共31页。目的:目的:目的:目的:介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有介绍作为实证模型建立方法的回归分析,以模拟具有(jyu)(jyu)(jyu)(jyu)连续响应变量连续响应变量连续响应变量连续响应变量“Y“Y“Y“Y 的过程的过程的过程的过程定义:定义:定义:定义:实证实证实证实证基于观测值或
2、事实基于观测值或事实基于观测值或事实基于观测值或事实目标:目标:目标:目标:确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用确定何时使用回归,以及为什么使用理解使用回归方法构建一个连续理解使用回归方法构建一个连续理解使用回归方法构建一个连续理解使用回归方法构建一个连续“X“X“X“X变量变量变量变量(binling)(binling)(binling)(binling)与连续与连续与连续与连续“Y“Y“Y“Y响应变量响应变量响应变量响应变量(binling)(binling)(binling)(binling)的关系模型的关系模型的关系模型的关系
3、模型在在在在MinitabMinitabMinitabMinitab中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定中应用回归方法,根据数据拟合一条直线。在给定X X X X的情况下,用拟合的情况下,用拟合的情况下,用拟合的情况下,用拟合的直线方程式预测的直线方程式预测的直线方程式预测的直线方程式预测“Y“Y“Y“Y了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方法了解确定模型是否为所给定数据的最正确模型的数学方
4、法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法说明并理解确定模型是否为所给定数据的最正确模型的图形方法单变量单变量(binling)(binling)回归回归2第二页,共31页。什么是回归?什么是回归?什么是回归?什么是回归?描述描述描述描述(mio sh)“Y(mio sh)“Y(mio sh)“Y(mio sh)“Y与与与与“X“X“X“X关系的数学方法关系的数学方法关系的数学方法关系的数学方法 创立工序的创立工序的创立工序的创立工序的“模型模型模型模型Y=b0+b1
5、x+e Y=b0+b1x+e Y=b0+b1x+e Y=b0+b1x+e 其中:其中:其中:其中:b0b0b0b0为为为为Y Y Y Y截距截距截距截距b1b1b1b1为直线斜率为直线斜率为直线斜率为直线斜率e e e e为模型的误差项为模型的误差项为模型的误差项为模型的误差项为何要使用回归?为何要使用回归?为何要使用回归?为何要使用回归?寻找潜在的关键少数寻找潜在的关键少数寻找潜在的关键少数寻找潜在的关键少数“X“X“X“X 预测预测预测预测“Y“Y“Y“Y 优化优化优化优化“Y“Y“Y“Y 确定如何设置确定如何设置确定如何设置确定如何设置“X“X“X“X以优化以优化以优化以优化“Y“Y“Y
6、“Y何时使用回归?何时使用回归?何时使用回归?何时使用回归?筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键筛选被动数据历史或基准数据,以找到潜在的关键“X“X“X“X危险危险危险危险!不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行不要使用被动数据得出最终结论。还要继续进行DOEDOEDOEDOE试验设计试验设计试验设计试验设计记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系记住被动数
7、据是历史数据;这种关系当前可能并不存在当前可能并不存在当前可能并不存在当前可能并不存在 分析分析分析分析DOEDOEDOEDOE试验设计的结果试验设计的结果试验设计的结果试验设计的结果回归回归(hugu)(hugu)寻找寻找“Y“Y与与“X“X关系的方法关系的方法回归是一种必须谨慎回归是一种必须谨慎回归是一种必须谨慎回归是一种必须谨慎(jnshn)(jnshn)(jnshn)(jnshn)使用的强有力的工具使用的强有力的工具使用的强有力的工具使用的强有力的工具3第三页,共31页。单变量单变量(binling)(binling)回归回归我们可能对独立变量我们可能对独立变量我们可能对独立变量我们可
8、能对独立变量X X X X和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示和响应变量之间的关系感兴趣。表示(biosh)(biosh)(biosh)(biosh)它们之间关系的散它们之间关系的散它们之间关系的散它们之间关系的散点图可能如下所示:点图可能如下所示:点图可能如下所示:点图可能如下所示:假定真正的关系假定真正的关系假定真正的关系假定真正的关系(gun x)(gun x)(gun x)(gun x)为:为:为:为:线性关系线性关系线性关系线性关系(gun x)(gun x)(gun x)(gun x)存在存在存在存在“b0“b0“b0“b
9、0常数和常数和常数和常数和“b1“b1“b1“b1系数为固定、但未知的参数系数为固定、但未知的参数系数为固定、但未知的参数系数为固定、但未知的参数“X“X“X“X 为独立变量为独立变量为独立变量为独立变量“Y“Y“Y“Y 为观测的响应值为观测的响应值为观测的响应值为观测的响应值“e“e“e“e 为误差。常见的误差假设有:为误差。常见的误差假设有:为误差。常见的误差假设有:为误差。常见的误差假设有:平均值为平均值为平均值为平均值为0.00.00.00.0不相关不相关不相关不相关正态分布正态分布正态分布正态分布误差不存在型式的分布误差不存在型式的分布误差不存在型式的分布误差不存在型式的分布Y Y
10、Y Yi i i i =b b b bo o o o +b +b +b +b1 1 1 1 *X *X *X *Xi i i i+e e e ei i i i4第四页,共31页。收集数据收集数据收集数据收集数据 以估测方程以估测方程以估测方程以估测方程(fngchng)(fngchng)(fngchng)(fngchng)的最正确方法是什么?的最正确方法是什么?的最正确方法是什么?的最正确方法是什么?“b0“b0“b0“b0和和和和“b1“b1“b1“b1的估测值是多少的估测值是多少的估测值是多少的估测值是多少(dusho)(dusho)(dusho)(dusho)?这是否是正确这是否是正确这
11、是否是正确这是否是正确(zhngqu)(zhngqu)(zhngqu)(zhngqu)的函数形式直线?的函数形式直线?的函数形式直线?的函数形式直线?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?关系是否具有统计显著性不是偶然出现?误差误差误差误差“ei“ei“ei“ei有多大?有多大?有多大?有多大?与拟合方程相关的问题有:与拟合方程相关的问题有:5第五页,共31页。收集收集(shuj)(shuj)数据数据要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,将观测值的要使估计的斜率误差最小,
12、将观测值的1/21/21/21/2置于置于置于置于“X“X“X“X的下限,将其它的下限,将其它的下限,将其它的下限,将其它1/21/21/21/2置于上限,置于上限,置于上限,置于上限,并使独立变量在广范围内取值并使独立变量在广范围内取值并使独立变量在广范围内取值并使独立变量在广范围内取值这适用于这适用于这适用于这适用于Y Y Y Y值高度值高度值高度值高度(god)(god)(god)(god)变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为变化、独立变量的范围较小、而且它们之间的关系预期为
13、直线的情形直线的情形直线的情形直线的情形-1-1-1-11 1 1 1x x x xy y y y要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,要确定关系的形式是直线还是曲线?,采用两级以上的独立变量。如果采用两级以上的独立变量。如果采用两级以上的独立变量。如果采用两级以上的独立变量。如果(rgu)(rgu)(rgu)(rgu)数数数数据高度变化,常常采用据高度变化,常常采用据高度变化,常常采用据高度变化,常常采用3 3 3 3个级别个级别个级别个级别-1-1-1-11 1 1 1x x x xy y y y0 0 0 0最好是以随机顺序
14、收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的最好是以随机顺序收集数据,而不要以低值的“X“X“X“X开始然后逐渐递增开始然后逐渐递增开始然后逐渐递增开始然后逐渐递增 另一个随时另一个随时另一个随时另一个随时间变化的可能影响工序间变化的可能影响工序间变化的可能影响工序间变化的可能影响工序6第六页,共31页。MinitabMinitab的单变量的单变量(binling)(binling)回归回归在在在在MinitabMinitabMinitabMinitab中翻开新工作表,并在中翻开新工作表,并在中翻开新工作表,并在中翻开新工作表,并在C
15、1C1C1C1和和和和C2C2C2C2中输入中输入中输入中输入(shr)(shr)(shr)(shr)以下数据:以下数据:以下数据:以下数据:举例举例举例举例(j l):(j l):(j l):(j l):您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过以下数据证明这种关系的存在数据证明这种
16、关系的存在数据证明这种关系的存在数据证明这种关系的存在7第七页,共31页。看上去是线性看上去是线性看上去是线性看上去是线性!1)1)始终首先将数据始终首先将数据(shj)(shj)制图制图GraphPlotGraphPlotGraphPlotGraphPlot单击单击单击单击“OK“OK“OK“OK 运行运行运行运行(ynxng)(ynxng)(ynxng)(ynxng)8第八页,共31页。2)2)运行数据的回归运行数据的回归(hugu)(hugu)分析分析自变量自变量自变量自变量单击单击单击单击 Graphs Graphs Graphs Graphs 单击单击单击单击 Storage Sto
17、rage Storage Storage StatRegressionRegression.StatRegressionRegression.StatRegressionRegression.StatRegressionRegression.(参见参见参见参见(cnjin)(cnjin)(cnjin)(cnjin)下页的子对话框下页的子对话框下页的子对话框下页的子对话框 并并并并9第九页,共31页。此对话框用于生成此对话框用于生成此对话框用于生成此对话框用于生成(shn(shn(shn(shn chn)chn)chn)chn)残差残差残差残差(误差误差误差误差)图图图图采用这些图形检验您的模型
18、采用这些图形检验您的模型采用这些图形检验您的模型采用这些图形检验您的模型中有关误差的假设中有关误差的假设中有关误差的假设中有关误差的假设单击此框,指明您想看的图形单击此框,指明您想看的图形单击此框,指明您想看的图形单击此框,指明您想看的图形单击单击单击单击OK,OK,OK,OK,然后然后然后然后(rnhu)(rnhu)(rnhu)(rnhu)单击对话框中的单击对话框中的单击对话框中的单击对话框中的 Storage Storage Storage Storage 按钮按钮按钮按钮单击单击单击单击Fits Fits Fits Fits 和和和和 Residuals Residuals Residu
19、als Residuals,以在数据窗,以在数据窗,以在数据窗,以在数据窗口存储口存储口存储口存储(cn ch)(cn ch)(cn ch)(cn ch)信息信息信息信息点击点击点击点击 OKOKOKOK 两次两次两次两次10第十页,共31页。“X“X“X“X 变量变量变量变量(binling)(binling)(binling)(binling)的的的的p p p p值值值值-速度速度速度速度 Ho:Ho:Ho:Ho:斜率斜率斜率斜率=0=0=0=0 Ha:Ha:Ha:Ha:斜率斜率斜率斜率=0=0=0=0或者,另一种表达方式:或者,另一种表达方式:或者,另一种表达方式:或者,另一种表达方式
20、:Ho:“X Ho:“X Ho:“X Ho:“X 不显著不显著不显著不显著 Ha:“X Ha:“X Ha:“X Ha:“X 显著显著显著显著会话窗口包含会话窗口包含(bohn)(bohn)分析结果分析结果.关于会话窗口输出结果关于会话窗口输出结果关于会话窗口输出结果关于会话窗口输出结果(ji gu)(ji gu)(ji gu)(ji gu)的进一步描述,可参见附录的进一步描述,可参见附录的进一步描述,可参见附录的进一步描述,可参见附录接受接受接受接受HHHHa a a a无法拒绝无法拒绝无法拒绝无法拒绝HHHHo o o o“Ctrl-M”Ctrl-M”Ctrl-M”Ctrl-M”移至会话窗口
21、移至会话窗口移至会话窗口移至会话窗口常数常数常数常数的的的的p-p-p-p-值值值值HHHH0 0 0 0:直线通过原点直线通过原点直线通过原点直线通过原点(0,0)(0,0)(0,0)(0,0)(0(0(0(0速度速度速度速度=0=0=0=0蒸发蒸发蒸发蒸发)H HH Ha a a a:直线不通过原点直线不通过原点直线不通过原点直线不通过原点(0,0)(0,0)(0,0)(0,0)11第十一页,共31页。s:s:s:s:残差残差残差残差(误差误差误差误差)的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程
22、式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离(对于优秀的模型,此值应较对于优秀的模型,此值应较对于优秀的模型,此值应较对于优秀的模型,此值应较小小小小)s=MS(error)1/2s=MS(error)1/2s=MS(error)1/2s=MS(error)1/2R-Sq:R-Sq:R-Sq:R-Sq:由拟合线由拟合线由拟合线由拟合线“解释的总变差的百分数。由解释的总变差的百分数。由解释的总变差的百分数。由解释的总变差的百分数。由“X“X“X“X解释的变差。
23、解释的变差。解释的变差。解释的变差。(对于优秀的模型,此值应较大对于优秀的模型,此值应较大对于优秀的模型,此值应较大对于优秀的模型,此值应较大(jio d)(jio d)(jio d)(jio d)R-Sq(adj):R-Sq(adj):R-Sq(adj):R-Sq(adj):对过于拟合情况对过于拟合情况对过于拟合情况对过于拟合情况(方程式中的变量过多方程式中的变量过多方程式中的变量过多方程式中的变量过多)的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个数进行比照的调整,它将包括模型中的项数与观测值的个
24、数进行比照其中其中其中其中 n=n=n=n=观测值数量观测值数量观测值数量观测值数量 p=p=p=p=模型中项数,包括常数模型中项数,包括常数模型中项数,包括常数模型中项数,包括常数请参见附录请参见附录请参见附录请参见附录(fl)(fl)(fl)(fl)更多的定义更多的定义更多的定义更多的定义R R R R2 2 2 2越大,模型对工序模拟得越好越大,模型对工序模拟得越好越大,模型对工序模拟得越好越大,模型对工序模拟得越好对于良好的模型,该值对于良好的模型,该值对于良好的模型,该值对于良好的模型,该值应接近应接近应接近应接近R R R R2 2 2 2值值值值该值越小该值越小该值越小该值越小(
25、误差的大小误差的大小误差的大小误差的大小),模型越好模型越好模型越好模型越好R R2 2=SS=SSregressionregressionSSSStotaltotal12第十二页,共31页。通过查看通过查看通过查看通过查看(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj)(chkn)R-Sq,R-Sq(adj),s s s s和和和和p p p p值值值值来评估模型来评估模型来评估模型来评估模型SSregression:SSregression:由模型中的由模型中的由模型中的由模型中的“X“X而解释的响应变量而解释的响应变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 初步 回归 分析 培训资料
限制150内