数理统计CH回归分析00002.ppt
数理统计CH回归分析00002 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望7.1 7.1 变量间的关系7.27.2 一元线性回归7.3 7.3 多元线性回归7.4 7.4 回归注意事项本章内容本章内容7 回归分析山西农业大学2应用数理统计 第7章7.2.3 回归预测ResponseEstimatebyLinearRegressionModel7.2 一元线性回归山西农业大学3应用数理统计 第7章7.2.3 回归预测(1)预测问题当回归方程检验显著并有较大的决定系数时可将其用于回归预测给定x,求y的估计值和置信区间称作回归预测山西农业大学4应用数理统计 第7章7.2.3 回归预测(2)响应y的点预测点预测公式山西农业大学5应用数理统计 第7章7.2.3 回归预测(3)点预测的期望和方差山西农业大学6应用数理统计 第7章7.2.3 回归预测(4)响应统计量分布响应预测的分布响应预测差的分布引用独立性响应模型山西农业大学7应用数理统计 第7章7.2.3 回归预测(5)响应的区间预测t 统计量山西农业大学8应用数理统计 第7章7.2.3 回归预测(5)响应的区间预测响应区间估计响应预测差的置信区间和置信度山西农业大学9应用数理统计 第7章7.2.3 回归预测(5)响应的区间预测响应区间估计响应的置信区间和置信度山西农业大学10应用数理统计 第7章7.2.3 回归预测(6)回归预测案例响应的点预测和区间预测山西农业大学11应用数理统计 第7章7.2.3 回归预测(6)回归预测案例响应的点预测和区间预测x0y0估计 L y0_CL y0_CU2.0112.5810 41.6143 70.9667154.19532.8176.8578 38.1417 138.7161214.99953.6241.1346 36.1312 205.0034277.26584.4305.4114 35.8297 269.5817341.24115.2369.6882 37.2787 332.4095406.96696.0433.9650 40.2897 393.6753474.25476.8498.2418 44.5472 453.6946542.7890y0的点预测和区间预测山西农业大学12应用数理统计 第7章7.2.3 回归预测(6)回归预测案例试验范围内响应预测x0=2:0.2:6.4山西农业大学13应用数理统计 第7章7.2.3 回归预测(6)回归预测案例禁止试验范围外对响应进行预测x0=0:0.5:25山西农业大学14应用数理统计 第7章7.2 一元线性回归7.2.4 可线性化非线性回归LinearRegressionbyTransformedNonlinearModels山西农业大学15应用数理统计 第7章7.2.4 可线性化非线性回归(1)问题的提出0RFModelErrorSSRSSE1n-2SSR/1SSE/(n-2)MSR/MSEpTotalSST n-1The ANOVA Table7.2.4 可线性化非线性回归(2)非线性模型线性回归步骤步骤步骤7 7:利用线性变换后的样本数据进行方差分析,检验回归显著性山西农业大学22应用数理统计 第7章7.2.4 可线性化非线性回归(3)可线性化非线性回归案例案例案例:出钢时,钢水对耐火材料的侵蚀使钢包容积不断增加。成对测定了钢包使用次数(X)和容积增大量(Y)数据,试求描述响应变量Y与自变量X关系的经验公式(回归方程)。XY23456789101112131415166.428.209.589.509.7010.009.939.9910.4910.5910.6010.8010.6010.9010.76山西农业大学23应用数理统计 第7章7.2.4 可线性化非线性回归(4)案例双曲线回归根据试验观测散点图的特征选双曲线模型线性化变换山西农业大学24应用数理统计 第7章XYxy23456789101112131415166.428.209.589.509.7010.009.939.9910.4910.5910.6010.8010.6010.9010.760.50000.33330.25000.20000.16670.14290.12500.11110.10000.09090.08330.07690.07140.06670.06250.15580.12200.10440.10530.10310.10000.10070.10010.09530.09440.09430.09260.09430.09170.09297.2.4 可线性化非线性回归(4)案例双曲线回归试验观测的线性化变换山西农业大学25应用数理统计 第7章7.2.4 可线性化非线性回归(4)案例双曲线回归XYxy23456789101112131415166.428.209.589.509.7010.009.939.9910.4910.5910.6010.8010.6010.9010.760.50000.33330.25000.20000.16670.14290.12500.11110.10000.09090.08330.07690.07140.06670.06250.15580.12200.10440.10530.10310.10000.10070.10010.09530.09440.09430.09260.09430.09170.0929n=15Total x*y=0.27265T=x2.38071.5469T2/n0.37785 0.15953 x20.58433 0.16333线性回归数据计算山西农业大学26应用数理统计 第7章SSx=0.58433-0.37785=0.20648,n=15SP=0.27265-2.38071.5469/15=0.02714b=SP/SSx=0.02714/0.20648=0.13144a=1.5469/15-b2.3807/15=0.08227SST=SSy=0.16333-0.15953=0.00380SSR=SP2/SSx=0.027142/0.20648=0.00357SSE=SST-SSR=0.0038-0.00357=0.000237.2.4 可线性化非线性回归(4)案例双曲线回归线性回归估计和平方和计算山西农业大学27应用数理统计 第7章R2=SSR/SST=0.00357/0.0038=0.9395SourceSSdfMSF valuePrFModelError0.003570.000231130.003571.7692e-5201.78 FModelError0.254570.010931130.254578.4077e-4302.78 FModelErrorSSRSSEmn-m-1SSR/mSSE/(n-m-1)MSR/MSETotalSSTn-1模型检验方差分析表7.3 多元线性回归(6)回归模型检验山西农业大学55应用数理统计 第7章(7)回归参数检验7.3 多元线性回归山西农业大学56应用数理统计 第7章7.3 多元线性回归(8)Hald水泥问题回归分析X1X2X3X4Y72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.4山西农业大学57应用数理统计 第7章7.3 多元线性回归(8)Hald水泥问题回归分析X1X2X3X4Y72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.4山西农业大学58应用数理统计 第7章7.3 多元线性回归(8)Hald水泥问题回归分析SourceSSdfMSF valuePrFModel 2667.904666.975111.4794.7562e-007Error47.8685.983Total2715.76 12Hald水泥问题模型检验方差分析表回归模型显著性检验山西农业大学59应用数理统计 第7章7.3 多元线性回归(8)Hald水泥问题回归分析SourceSSdfMSF valueF0.05(4,8)Model 2667.904666.975111.4793.8379Error47.8685.983Total2715.76 12Hald水泥问题模型检验方差分析表回归模型显著性检验山西农业大学60应用数理统计 第7章7.3 多元线性回归(8)Hald水泥问题回归分析parameter estimate t value Pr|t|62.4054 0.8910.399111.55112.0830.070820.51020.7050.500930.10190.1350.89594-0.1441-0.203 0.8441Hald水泥问题参数估计和检验回归参数显著性检验山西农业大学61应用数理统计 第7章 模型检验的方差分析结果表明,线性模型零假设在0.0001水平上被拒绝,且决定系数达0.9824,说明响应变量与自变量间存在很强的线性关系,响应观测值与回归预测值之间的残差较小。因此,回归模型拟合良好并具有较高的预测精度。7.3 多元线性回归(8)Hald水泥问题回归分析山西农业大学62应用数理统计 第7章 回归参数的t检验结果表明,回归系数零假设在0.05水平上均被接受,即回归系数都不显著,这与响应变量与自变量间存在很强线性关系的结论矛盾,说明自变量之间存在较强的线性相关。因此,需要选用其它回归方法来改进回归分析的结果。7.3 多元线性回归(8)Hald水泥问题回归分析山西农业大学63应用数理统计 第7章7 回归分析7.4 回归注意事项TakingNoticetoSomething山西农业大学64应用数理统计 第7章在实际中应用回归方程应谨慎:(1)禁止回归方程外推;(2)试验实施和应用场合的非处理因素(条件)应大致相当;(3)禁止回归方程逆向使用;(4)x和y均为随机变量时,只有部分回归公式仍适用。7.4 回归注意事项(1)回归方程的应用山西农业大学65应用数理统计 第7章7.4 回归注意事项自变量x增加或减少1 1个单位则y平均增加或减少 1 1个单位的说法应谨慎!(2)回归系数的应用山西农业大学66应用数理统计 第7章 回归方程是在一定的自变量观测范围内建立的,在自变量观测范围之外使用回归方程,称作回归的外推;如果在自变量观测范围之内使用,就叫做内插。内插使用上一般没什么问题,但外推使用有可能存在很大的偏差,故一般不主张对回归方程做外推使用,没把握就不要使用。7.4 回归注意事项(3)禁止回归方程外推山西农业大学67应用数理统计 第7章7.4 回归注意事项(3)禁止回归方程外推 用x从4到16的试验观测得一条决定系数达0.9508的回归直线,由此预测x=24 处的响应 y 会导致很大偏差,而且y与x为线性关系的结论也是错误的。山西农业大学68应用数理统计 第7章7.4 回归注意事项(3)禁止回归方程外推 用x从2到16的试验观测得到一条决定系数0.9582的指数回归曲线,由此做出y与x是指数关系的结论较恰当。山西农业大学69应用数理统计 第7章 禁止超越x 的试验范围解释回归系数,超范围解释可能造成与实际的严重偏离。例如,产量y的平均值大致随施肥量x的增加呈线性增长。但超出一定范围,如施肥量过大,则进一步增加施肥量不仅不能促进增产,反而可能产生肥害导致减产。7.4 回归注意事项合理解释回归系数(3)禁止回归方程外推山西农业大学70应用数理统计 第7章 注意试验实施与应用场合的非处理因素应大致相当(背景条件一致性),否则在x试验范围内解释回归系数仍可能出问题。例如,在贫瘠土壤上实施试验并建立产量与施肥量的回归方程,若给定施肥量并用该回归方程预测肥沃田地的产量就会产生错误结论。7.4 回归注意事项(4)试验和应用的条件一致性山西农业大学71应用数理统计 第7章7.4 回归注意事项(5)禁止回归方程逆向使用 由x做自变量和y做因变量得到的回归方程导出y做自变量和x做因变量的回归方程,再去应用称作逆向使用。例如,如果你想要通过身高x来预测体重y,则选x做自变量和y做因变量,估计出回归方程;如果你想要通过体重y预测身高x,则你并不能直接利用上述回归方程,而必须从头做起,取y做自变量和x做因变量,估计一个新的回归方程。山西农业大学72应用数理统计 第7章7.4 回归注意事项(5)禁止回归方程逆向使用同一组观测两线性回归山西农业大学73应用数理统计 第7章7.4 回归注意事项(5)禁止回归方程逆向使用 注意,强调回归方程不能逆向使用是指用于预测,而用于控制则另当别论。例如,为要把y值控制到尽可能小的误差,自变量x应取何值?山西农业大学74应用数理统计 第7章 只假定响应y 是随机变量的线性回归结果不适用于x和y均为随机变量的情况,但下述特定条件下部分回归结果还可用:(1)(1)(x,y)服从二维正态联合分布,除回归参数的方差计算公式外,其余公式仍适用。(2)(2)(x,y)的联合分布不是正态分布,只有回归参数的估计公式仍适用。7.4 回归注意事项(6)x和y均为随机变量的回归山西农业大学75应用数理统计 第7章结束结束7 回归分析山西农业大学76应用数理统计 第7章