ch统计回归模型实用.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《ch统计回归模型实用.pptx》由会员分享,可在线阅读,更多相关《ch统计回归模型实用.pptx(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、10.1 牙膏的销售量牙膏的销售量 问问题题建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价 9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其它厂家价格(元)本公司价格(元)销售周期第1页/共43页基本模型基本模型y 公司牙膏销售量x1其它厂家与本公司价格差x2公司广告费用x2yx1yx1,x2解释变量(
2、回归变量,自变量)y被解释变量(因变量)0,1,2,3 回归系数 随机误差(均值为零的正态分布随机变量)第2页/共43页MATLAB 统计工具箱 模型求解模型求解b,bint,r,rint,stats=regress(y,x,alpha)输入 x=n 4数据矩阵,第1列为全1向量alpha(置信水平,0.05)b 的估计值 bintb的置信区间 r 残差向量y-xb rintr的置信区间 Stats检验统计量 R2,F,p yn维数据向量输出 由数据 y,x1,x2估计 参数参数估计值置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6956-7.4
3、989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3第3页/共43页结果分析结果分析y的90.54%可由模型确定 参数参数估计值置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3F远超过F检验的临界值 p远小于=0.05 2的置信区间包含零点(右端点距零点很近)x2对因变量y 的影响不太显著x22项显著 可将x2保留在模型
4、中 模型从整体上看成立第4页/共43页销售量预测销售量预测 价格差x1=其它厂家价格x3-本公司价格x4估计x3调整x4控制价格差x1=0.2元,投入广告费x2=650万元销售量预测区间为 7.8230,8.7636(置信度95%)上限用作库存管理的目标值 下限用来把握公司的现金流 若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在 7.8320 3.7 29(百万元)以上控制x1通过x1,x2预测y(百万支)第5页/共43页模型改进模型改进x1和x2对y的影响独立 参数参数估计值置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6
5、956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3参数参数估计值置信区间29.113313.7013 44.525211.13421.9778 20.2906-7.6080-12.6932 -2.5228 0.67120.2538 1.0887-1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p=0.0000 3 0 1 2 4x1和x2对y的影响有交互作用第6页/共43页两模型销售量预测两模型销售量预测比较比较(百万支)区间 7.8230,8.7636区间 7
6、.8953,8.7592(百万支)控制价格差x1=0.2元,投入广告费x2=6.5百万元预测区间长度更短 略有增加 第7页/共43页x2=6.5x1=0.2 x1x1x2x2两模型两模型 与与x1,x2关系的关系的比较比较第8页/共43页交互作用影响的讨论交互作用影响的讨论价格差 x1=0.1 价格差 x1=0.3加大广告投入使销售量增加(x2大于6百万元)价格差较小时增加的速率更大 x2价格优势会使销售量增加 价格差较小时更需要靠广告来吸引顾客的眼球 第9页/共43页完全二次多项式模型完全二次多项式模型 MATLAB中有命令rstool直接求解x1x2从输出 Export 可得第10页/共4
7、3页10.2 软件开发人员的薪金软件开发人员的薪金资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考 编号薪金资历管理教育0113876111021160810303187011130411283102编号薪金资历管理教育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料 第11页/共43页分析与假设分析与假设 y 薪金,x1 资历(年)x2=1 管理人员,x2=0
8、 非管理人员1=中学2=大学3=更高资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用 教育线性回归模型线性回归模型 a0,a1,a4是待估计的回归系数,是随机误差 中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0 第12页/共43页模型求解模型求解参数参数估计值置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994-3826 -2162 a4148-636 931 R2=0.957 F=226 p=0.000R2,F,p 模型整体上可用资历增加1年薪金增长546 管理人员薪金多6883
9、 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 a4置信区间包含零点,解释不可靠!中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0.x2=1 管理,x2=0 非管理x1资历(年)第13页/共43页残差分析方法 结果分析结果分析残差e 与资历x1的关系 e与管理教育组合的关系 残差全为正,或全为负,管理教育组合处理不当 残差大概分成3个水平,6种管理教育组合混在一起,未正确反映。应在模型中增加管理x2与教育x3,x4的交互项 组合123456管理010101教育112233管理与教育的组合第14页/共43页进一步的模型进一步的模型增加管理x2与教育x3
10、,x4的交互项参数参数估计值置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372-2769a618361571 2101R2=0.999 F=554 p=0.000R2,F有改进,所有回归系数置信区间都不含零点,模型完全可用 消除了不正常现象 异常数据(33号)应去掉 e x1 e 组合第15页/共43页去掉异常数据后去掉异常数据后的结果的结果参数参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1
11、737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2=0.9998 F=36701 p=0.0000e x1 e 组合R2:0.957 0.999 0.9998F:226 554 36701 置信区间长度更短残差图十分正常最终模型的结果可以应用第16页/共43页模型应用模型应用 制订6种管理教育组合人员的“基础”薪金(资历为0)组合管理教育系数“基础”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a21824
12、1中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0 x1=0;x2=1 管理,x2=0 非管理大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略低 第17页/共43页对定性因素(如管理、教育),可以引入0-1变量处理,0-1变量的个数应比定性因素的水平少1 软件开发人员的薪金软件开发人员的薪金残差分析方法可以发现模型的缺陷,引入交互作用项常常能够改善模型 剔除异常数据,有助于得到更好的结果注:可以直接对6种管理教育组合引入5个0-1变量 第18页/共43页10.3 酶促反应酶促反应 问问题题研究酶促反应(酶催化反应)中嘌呤霉素
13、对反应速度与底物(反应物)浓度之间关系的影响 建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系 设计了两个实验:酶经过嘌呤霉素处理;酶未经嘌呤霉素处理。实验数据见下表:方方案案底物浓度底物浓度(ppm)0.020.060.110.220.561.10反应反应速度速度处理处理764797107123 139 159 152 191 201 207 200未处理未处理6751848698115 131 124 144 158 160/第19页/共43页基本模型基本模型 Michaelis-Menten模型y 酶促反应的速度,x 底物浓度 1,2 待定系数 底物浓度较小时
14、,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值。酶促反应的基本性质 xy0 1实验数据经嘌呤霉素处理xy未经嘌呤霉素处理xy第20页/共43页线性化模型线性化模型 经嘌呤霉素处理后实验数据的估计结果 参数参数参数估计值(参数估计值(10-3)置信区间(置信区间(10-3)15.1073.539 6.676 20.2470.176 0.319R2=0.8557 F=59.2975 p=0.0000对 1,2非线性 对 1,2线性 第21页/共43页线性化模型结果分析线性化模型结果分析 x较大时,y有较大偏差 1/x较小时有很好的线性趋势,1/x较大时出现很大的起落 参数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ch 统计 回归 模型 实用
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内