统计回归模型.pdf
《统计回归模型.pdf》由会员分享,可在线阅读,更多相关《统计回归模型.pdf(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计回归模型统计回归模型10.1 10.1 10.1 10.1 牙膏的销售量牙膏的销售量10.2 10.2 10.2 10.2 软件开发人员的薪金软件开发人员的薪金10.3 10.3 10.3 10.3 酶促反应酶促反应10.4 10.4 10.4 10.4 投资额与国民生产总值和投资额与国民生产总值和 物价指数物价指数 福彩3D 回归模型是用回归模型是用统计分析方法建立的最常用的一类模型统计分析方法建立的最常用的一类模型 数学建模的基本方法数学建模的基本方法机理分析机理分析测试分析测试分析通过对数据的统计分析,找出与数据拟合最好的模型通过对数据的统计分析,找出与数据拟合最好的模型 不涉及回归
2、分析的数学原理和方法不涉及回归分析的数学原理和方法 通过实例讨论如何选择不同类型的模型通过实例讨论如何选择不同类型的模型 对软件得到的结果进行分析,对模型进行改进对软件得到的结果进行分析,对模型进行改进 由于客观事物内部规律的复杂及人们认识程度的限制由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。律的数学模型。10.110.110.110.1 牙膏的销售量牙膏的销售量 问问题题建立牙膏销售量与价格、广告投入之间的模型建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏
3、销售量预测在不同价格和广告费用下的牙膏销售量 收集了收集了30303030个销售周期本公司牙膏销售量、价格、个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价广告费用,及同期其它厂家同类牙膏的平均售价 9.269.269.269.260.550.550.550.556.806.806.806.804.254.254.254.253.703.703.703.70303030307.937.937.937.930.050.050.050.055.805.805.805.803.853.853.853.853.803.803.803.80292929298.518.518.
4、518.510.250.250.250.256.756.756.756.754.004.004.004.003.753.753.753.752 2 2 27.387.387.387.38-0.05-0.05-0.05-0.055.505.505.505.503.803.803.803.803.853.853.853.851 1 1 1销售量销售量(百万支百万支)价格差价格差(元)(元)广告费用广告费用(百万元百万元)其它厂家其它厂家价格价格(元元)本公司价本公司价格格(元元)销售销售周期周期基本模型基本模型y y y y 公司牙膏销售量公司牙膏销售量x x x x1 1 1 1 其它厂家与本公
5、司其它厂家与本公司价格差价格差x x x x2 2 2 2 公司广告费用公司广告费用+=110 xy+=222210 xxy55.566.577.577.588.599.510 x2y-0.200.20.40.677.588.599.510 x1y+=22322110 xxxyx x x x1 1 1 1,x x x x2 2 2 2 解释变量解释变量(回归变量回归变量,自变量自变量)y y y y 被解释变量(因变量)被解释变量(因变量)0 0 0 0,1 1 1 1 ,2 2 2 2,3 3 3 3 回归系数回归系数 随机随机误差(误差(均值为零的均值为零的正态分布随机变量)正态分布随机变
6、量)MATLAB MATLAB MATLAB MATLAB 统计工具箱统计工具箱 模型求解模型求解b,bint,r,rint,stats=regress(y,x,alpha)b,bint,r,rint,stats=regress(y,x,alpha)b,bint,r,rint,stats=regress(y,x,alpha)b,bint,r,rint,stats=regress(y,x,alpha)输入输入 x=x=x=x=n n n n 4 4 4 4数数据矩阵据矩阵,第第1 1 1 1列为全列为全1 1 1 1向量向量1 2221xxxalphaalphaalphaalpha(置信置信水平
7、水平,0.050.050.050.05)+=22322110 xxxybbbb 的的估计值估计值 bintbintbintbint b b b b的置信区间的置信区间 r r r r 残差向量残差向量y y y y-xbxbxbxb rintrintrintrint r r r r的置信区间的置信区间 StatsStatsStatsStats 检验统计量检验统计量 R R R R2 2 2 2,F F F F,p p p p yyyyn n n n维数据向量维数据向量输出输出 由数据由数据 y y y y,x,x,x,x1 1 1 1,x x x x2 2 2 2估计估计 参数参数参数估计值参
8、数估计值置信区间置信区间17.324417.324417.324417.32445.7282 28.92065.7282 28.92065.7282 28.92065.7282 28.92061.30701.30701.30701.30700.6829 1.9311 0.6829 1.9311 0.6829 1.9311 0.6829 1.9311-3.6956-3.6956-3.6956-3.6956-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077 0.34860.34860.34860.34860.0379 0.6594 0.
9、0379 0.6594 0.0379 0.6594 0.0379 0.6594 R R R R2 2 2 2=0.9054 =0.9054 =0.9054 =0.9054 F F F F=82.9409 =82.9409 =82.9409 =82.9409 p p p p=0.0000=0.0000=0.0000=0.0000 0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3结果分析结果分析y y y y的的90.54%90.54%90.54%90.54%可由模型确定可由模型确定 参数参数参数估计值参数估计值置信区间置信区间17.324417.324417.324417.3244
10、5.7282 28.92065.7282 28.92065.7282 28.92065.7282 28.92061.30701.30701.30701.30700.6829 1.9311 0.6829 1.9311 0.6829 1.9311 0.6829 1.9311-3.6956-3.6956-3.6956-3.6956-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077 0.34860.34860.34860.34860.0379 0.6594 0.0379 0.6594 0.0379 0.6594 0.0379 0.6594
11、R R R R2 2 2 2=0.9054 =0.9054 =0.9054 =0.9054 F F F F=82.9409 =82.9409 =82.9409 =82.9409 p p p p=0.0000=0.0000=0.0000=0.0000 0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3+=22322110 xxxyF F F F远超过远超过F F F F检验的临界值检验的临界值 p p p p远小于远小于 =0.050.050.050.05 2 2 2 2的置信区间包含零点的置信区间包含零点(右端点距零点很近右端点距零点很近)x x x x2 2 2 2对因变量对因变
12、量y y y y 的的影响不太显著影响不太显著x x x x2 2 2 22 2 2 2项显著项显著 可将可将x x x x2 2 2 2保留在模型中保留在模型中 模型从整体上看成立模型从整体上看成立22322110 xxxy+=销售量预测销售量预测 价格差价格差x x x x1 1 1 1=其它厂家其它厂家价格价格x x x x3 3 3 3-本公司本公司价格价格x x x x4 4 4 4估计估计x x x x3 3 3 3调整调整x x x x4 4 4 4控制价格差控制价格差x x x x1 1 1 1=0.2=0.2=0.2=0.2元,投入广告费元,投入广告费x x x x2 2 2
13、 2=650=650=650=650万元万元销售量预测区间为销售量预测区间为 7.8230 7.8230 7.8230 7.8230,8.76368.76368.76368.7636(置信度(置信度95%95%95%95%)上限用作库存管理的目标值上限用作库存管理的目标值 下限用来把握公司的现金流下限用来把握公司的现金流 若估计若估计x x x x3 3 3 3=3.9=3.9=3.9=3.9,设定,设定x x x x4 4 4 4=3.7=3.7=3.7=3.7,则可以,则可以95%95%95%95%的把握知的把握知道销售额在道销售额在 7.8320 7.8320 7.8320 7.8320
14、 3.73.73.73.7 29292929(百万元)以上(百万元)以上控制控制x x x x1 1 1 1通过通过x x x x1 1 1 1,x x x x2 2 2 2预测预测y y y y2933.822322110=+=xxxy(百万支百万支)模型改进模型改进x x x x1 1 1 1和和x x x x2 2 2 2对对y y y y的的影响独立影响独立 +=22322110 xxxy+=21422322110 xxxxxy参数参数参数估计值参数估计值置信区间置信区间17.324417.324417.324417.32445.7282 28.92065.7282 28.92065.
15、7282 28.92065.7282 28.92061.30701.30701.30701.30700.6829 1.9311 0.6829 1.9311 0.6829 1.9311 0.6829 1.9311-3.6956-3.6956-3.6956-3.6956-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077-7.4989 0.1077 0.34860.34860.34860.34860.0379 0.6594 0.0379 0.6594 0.0379 0.6594 0.0379 0.6594 R R R R2 2 2 2=0.9054 =0.9054
16、=0.9054 =0.9054 F F F F=82.9409 =82.9409 =82.9409 =82.9409 p p p p=0.0000=0.0000=0.0000=0.0000 0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3参数参数参数估计值参数估计值置信区间置信区间29.113329.113329.113329.113313.7013 44.525213.7013 44.525213.7013 44.525213.7013 44.525211.134211.134211.134211.13421.9778 20.2906 1.9778 20.2906 1.9778
17、 20.2906 1.9778 20.2906-7.6080-7.6080-7.6080-7.6080-12.6932 -2.5228-12.6932 -2.5228-12.6932 -2.5228-12.6932 -2.5228 0.67120.67120.67120.67120.2538 1.0887 0.2538 1.0887 0.2538 1.0887 0.2538 1.0887-1.4777-1.4777-1.4777-1.4777-2.8518 -0.1037-2.8518 -0.1037-2.8518 -0.1037-2.8518 -0.1037 R R R R2 2 2 2=0
18、.9209 =0.9209 =0.9209 =0.9209 F F F F=72.7771 =72.7771 =72.7771 =72.7771 p p p p=0.0000=0.0000=0.0000=0.0000 3 3 3 3 0 0 0 0 1 1 1 1 2 2 2 2 4 4 4 4x x x x1 1 1 1和和x x x x2 2 2 2对对y y y y的影响有的影响有交互作用交互作用两模型销售量预测两模型销售量预测比较比较21422322110 xxxxxy+=22322110 xxxy+=2933.8=y(百万支百万支)区间区间 7.8230 7.8230 7.8230
19、7.8230,8.76368.76368.76368.7636区间区间 7.8953 7.8953 7.8953 7.8953,8.7592 8.7592 8.7592 8.7592 3272.8=y(百万支百万支)控制价格差控制价格差x x x x1 1 1 1=0.2=0.2=0.2=0.2元,投入广告费元,投入广告费x x x x2 2 2 2=6.5=6.5=6.5=6.5百万元百万元预测区间长度更短预测区间长度更短 略有增加略有增加 yx x x x2 2 2 2=6.5=6.5=6.5=6.5x x x x1 1 1 1=0.2=0.2=0.2=0.2-0.200.20.40.67
20、.588.59x x x x1 1 1 1y-0.200.20.40.67.588.59x x x x1 1 1 1y56787.588.599.510 x x x x2 2 2 2y567888.599.51010.5x x x x2 2 2 2y22322110 xxxy+=21422322110 xxxxxy+=两模型两模型 与与x x x x1 1 1 1,x x x x2 2 2 2关系的关系的比较比较y交互作用影响的讨论交互作用影响的讨论2221.06712.07558.72267.301xxyx+=价格差价格差 x x x x1 1 1 1=0.1=0.1=0.1=0.1 价格差
21、价格差 x x x x1 1 1 1=0.3=0.3=0.3=0.32223.06712.00513.84535.321xxyx+=21422322110 xxxxxy+=5357.72xxyy价格优势会使销售量增加价格优势会使销售量增加 价格差较小时更需要靠广告价格差较小时更需要靠广告来吸引顾客的眼球来吸引顾客的眼球 完全二次多项式模型完全二次多项式模型 +=22521421322110 xxxxxxyMATLABMATLABMATLABMATLAB中有命令中有命令rstoolrstoolrstoolrstool直接求解直接求解00.20.47.588.599.5105.566.57x x
22、x x1 1 1 1x x x x2 2 2 2y),(543210=从输出从输出 Export Export Export Export 可得可得10.2 10.2 10.2 10.2 软件开发人员的薪金软件开发人员的薪金资历资历 从事专业工作的年数;管理从事专业工作的年数;管理 1 1 1 1=管理人员,管理人员,0 0 0 0=非管理人非管理人员;教育员;教育 1 1 1 1=中学,中学,2 2 2 2=大学,大学,3 3 3 3=更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考
23、分析人事策略的合理性,作为新聘用人员薪金的参考 编编号号薪金薪金资资历历管管理理教教育育01010101138761387613876138761 1 1 11 1 1 11 1 1 102020202116081160811608116081 1 1 10 0 0 03 3 3 303030303187011870118701187011 1 1 11 1 1 13 3 3 304040404112831128311283112831 1 1 10 0 0 02 2 2 2编编号号薪金薪金资资历历管管理理教教育育4242424227837278372783727837161616161 1
24、1 12 2 2 24343434318838188381883818838161616160 0 0 02 2 2 24444444417483174831748317483161616160 0 0 01 1 1 14545454519207192071920719207171717170 0 0 02 2 2 24646464619346193461934619346202020200 0 0 01 1 1 146464646名软件开发人员的档案资料名软件开发人员的档案资料 分析与假设分析与假设 y y y y 薪金,薪金,x x x x1 1 1 1 资历(年)资历(年)x x x x
25、2 2 2 2=1 1 1 1 管理人员,管理人员,x x x x2 2 2 2=0 0 0 0 非管理人员非管理人员1 1 1 1=中学中学2 2 2 2=大学大学3 3 3 3=更高更高=其它中学,x013=其它大学,x014资历每加一年薪金的增长是常数;资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用管理、教育、资历之间无交互作用 教教育育+=443322110 xaxaxaxaay线性回归模型线性回归模型 a a a a0 0 0 0,a a a a1 1 1 1,a a a a4 4 4 4是待估计的回归系数,是待估计的回归系数,是随机误差是随机误差 中学:中学:x x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 回归 模型
限制150内