《模型统计模型精选PPT.ppt》由会员分享,可在线阅读,更多相关《模型统计模型精选PPT.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主讲人:孙云龙主讲人:孙云龙主讲人:孙云龙主讲人:孙云龙数学建模课件数学建模课件数学建模课件数学建模课件第1页,此课件共43页哦模型一模型一 牙膏的销售量牙膏的销售量v确定关系:牙膏销售量价格、广告投入v内部规律复杂数据统计分析常用模型回归模型数学原理软件v30个销售周期数据:销售量、价格、广告费用、同类产品均价销售周期公司价(元)它厂价(元)广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.51293.803.855.800.057.93303.704.256.800.559.26第2页,此课件共43页哦分析分析vy 公
2、司牙膏销售量vx1其它厂家与本公司价格差vx2公司广告费用解释变量(回归变量,自变量)被解释变量(因变量)y与x1y与 x2t1.mt2.mt5.m第3页,此课件共43页哦Matlab 统计分析统计分析vMATLAB7.0版本 s增加一个统计量:剩余方差s2b,bint,r,rint,stats=regress(y,X,alpha)3、回归分析statistics toolbox解释变量:矩阵显著性水平:0.05 系数估计值 置信区间 残差 置信区间 被解释变量:列检验统计量:R2,F,p 随机误差:正态分布均值为零回归系数rcoplot(r,rint)残差及其置信区间作图第4页,此课件共43
3、页哦于是于是v考察y与x1y与 x2v有v结果t4.m第5页,此课件共43页哦v多元回归模型模型MATLAB t3.mt1x=ones(size(x1),x1,x2,x2.2;b,bint,r,rint,stats=regress(y,x)程序第6页,此课件共43页哦结果分析结果分析v即:参数参数估计值置信区间017.32445.7282 28.920611.30700.6829 1.9311 2-3.6956-7.4989 0.1077 30.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000v显著性:整体显著y的90.54%可由模型确定、F远超过F
4、检验的临界值、p远小于=0.05vx2:2置信区间包含零点不显著;3 显著第7页,此课件共43页哦销售量预测销售量预测v控制价格差x1=0.2元,投入广告费x2=650万元v得:价差x1=它厂价x3-公司价x4估计x3,调整x4销售量预测区间为 7.8230,8.7636(置信度95%)?上限用作库存管理的目标值 v若估计x3=3.9,设定x4=3.7可以95%的把握知道销售额在 7.83203.7 29(百万元)以上(百万支)控制控制x1预测ylin.m第8页,此课件共43页哦模型改进模型改进vx1和x2对y的影响有交互作用交互项参数估计值置信区间估计值置信区间017.32445.7282
5、28.920629.113313.7013 44.525211.30700.6829 1.931111.13421.9778 20.29062-3.6956-7.4989 0.1077-7.6080-12.6932 -2.522830.34860.0379 0.65940.67120.2538 1.08874-1.4777-2.8518 -0.1037R2=0.9054 F=82.9409 p=0.0000R2=0.9209 F=72.7771 p=0.0000t6.m比较:置信区间、比较:置信区间、R2第9页,此课件共43页哦v控制价格差x1=0.2元,投入广告费x2=6.5百万元比较:销售
6、量预测比较:销售量预测(百万支)区间 7.8230,8.7636区间 7.8953,8.7592(百万支)预测区间长度更短 略有增加 第10页,此课件共43页哦 x2=6.5比较:两模型比较:两模型y与与x1,x2关系关系x1=0.2 x1x1x2x2第11页,此课件共43页哦讨论:交互作用影响讨论:交互作用影响v价格差 x1=0.1v价格差 x1=0.3广告投入y(x2大于6百万元)价格差较小时增加的速率更大 x2价格优势y 价格差较小广告作用大x1x2第12页,此课件共43页哦完全二次多项式模型完全二次多项式模型v MATLAB相应面分析Rstool(x,y,model,alpha,xna
7、me,yname)linearinteractionquadraticpurequadratic线性项常数项、线性项、交叉项交叉项、平方项常数项、线性项、平方项第13页,此课件共43页哦v相应面分析 rstool(x(:,2:3),y)x1x2Export:vall:beta rmse residualsv 系数 均方差 残差第14页,此课件共43页哦评注评注v回归模型数据、经验、图形回归变量、函数形式vMatlab求解统计分析:R2、F、p回归系数置信区间包含0点改进添加二次项、交叉项第15页,此课件共43页哦模型二模型二 软件开发人员的薪金软件开发人员的薪金v薪金资历、岗位、学历v建立模型
8、:分析人事策略的合理性,作为新聘用人员薪金的参考 资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度46名软件开发人员的档案资料 编号薪金资历管理教育011387611102116081034519207170246193462001第16页,此课件共43页哦模型假设模型假设v假设:y 薪金,x1 资历(年)x2=1 管理人员,0 非管理人员1 中学 2 大学 3 更高?v假设:资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用 教育=模型:线性回归模型:线性回归回归系数 随机误差 中学:x3=1,x4=0;大学:x3=0,x4=1;
9、更高:x3=0,x4=0 第17页,此课件共43页哦模型求解模型求解v x1资历(年)v x2=1 管理,0 非管理v中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0Matlab程序:xinjindata.m xinjin.m v xinjindata.m:序号、工资y、资历x1、管理x2、学历、x3、x4、xxv xinjin.m:M=dlmread(xinjindata.m);x1=M(:,3);x2=M(:,4);x3=M(:,6);x4=M(:,7);y=M(:,2);x=ones(size(x1)x1 x2 x3 x4 b,bi,r,ri,s=regres
10、s(y,x)第18页,此课件共43页哦vR2,F,p 模型整体上可用资历增加1年薪金增长546管理人员薪金多6883中学程度薪金比更高的少2994大学程度薪金比更高的多148v a4置信区间包含零点 解释不可靠!结果结果参数估计值置信区间a01103210258 11807a1546 484 608 a268836248 7517a3-2994-3826 -2162a4148-636 931 R2=0.957 F=226 p=0.000第19页,此课件共43页哦结果分析结果分析v残差分析法残差v 与资历x1的关系 残差大概分成3个水平6种管理教育组合混在一起,未正确反映 Matlab:xinj
11、in2.m 第20页,此课件共43页哦v 与管理x2教育x3、x4的关系残差全为正,或全为负,管理教育组合处理不当 应在模型中增加管理x2与教育x3,x4的交互项 组合123456管理010101教育112233管理与教育的组合残差分析残差分析第21页,此课件共43页哦模型改进模型改进v增加管理x2与教育x3,x4的交互项R2,F有改进回归系数置信区间不含零点模型可用 参数估计值置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372-2769a618361571
12、2101R2=0.999 F=554 p=0.000Matlab:xinjin3.m 第22页,此课件共43页哦v消除了不正常现象v异常数据(33号)去掉残差分析残差分析e x1 e 组合Matlab:xinjin4.m 第23页,此课件共43页哦v去掉异常数据后的结果模型改进模型改进R2:0.957 0.999 0.9998F:226 554 36701 置信区间长度更短xinjindata2.mxinjin1.m 参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-
13、3056-3171 2942a619971894 2100R2=0.9998 F=36701 p=0.0000第24页,此课件共43页哦残差分析残差分析v残差图正常v模型的结果可以应用 x1 组合xinjin2.m 第25页,此课件共43页哦模型应用模型应用v制订基础薪金资历为0:x1=0 管理教育组合:6种大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略低 组合管理教育系数基础薪金101非管理+中学a0+a39463211管理+中学a0+a2+a3+a513448302非管理+大学a0+a410844412管理+大学a0+a2+a4+a6198825
14、03非管理+更高a011200613管理+更高a0+a218241教育1中学:x3=1,x4=0 2大学:x3=0,x4=13更高:x3=0,x4=0 第26页,此课件共43页哦评注评注v 对定性因素:如管理、教育可以引入0-1变量处理0-1变量的个数应比定性因素的水平少1v残差分析:可以发现模型的缺陷引入交互作用项常常能够改善模型 v剔除:异常数据有助于得到更好的结果v另:可以直接对6种管理教育组合引入5个0-1变量第27页,此课件共43页哦模型三模型三 酶促反应酶促反应v酶促反应酶促反应由酶作为催化剂催化进行的化学反应由酶作为催化剂催化进行的化学反应生物体内的化学反应绝大多数属于酶促反应生
15、物体内的化学反应绝大多数属于酶促反应酶促反应中酶作为高效催化剂使得反应以极快的速酶促反应中酶作为高效催化剂使得反应以极快的速度(度(1031017倍)或在一般情况下无法反应的条件倍)或在一般情况下无法反应的条件下进行下进行酶是生物体内进行各种化学反应最重要的因素酶是生物体内进行各种化学反应最重要的因素v酶促反应动力学酶促反应动力学v问题:问题:研究酶促反应中研究酶促反应中嘌呤霉素嘌呤霉素对反应速度与底对反应速度与底物(反应物)浓度之间关系的影响物(反应物)浓度之间关系的影响第28页,此课件共43页哦方案方案v建立数学模型,反映该酶促反应的速度与底物浓度建立数学模型,反映该酶促反应的速度与底物浓
16、度以及经嘌呤霉素处理与否之间的关系以及经嘌呤霉素处理与否之间的关系v设计了两个实验设计了两个实验酶经过嘌呤霉素处理酶经过嘌呤霉素处理酶未经嘌呤霉素处理酶未经嘌呤霉素处理v实验数据实验数据:底物浓度底物浓度(ppm)(ppm)0.020.060.11反应速反应速度度处理处理764797107123139未处理未处理6751848698115底物浓度底物浓度(ppm)(ppm)0.220.561.10反应速反应速度度处理处理159152191201207200未处理未处理131124144158160/第29页,此课件共43页哦v酶促反应的基本性质底物浓度较小时,反应速度大致与浓度成正比;底物浓度
17、很大、渐进饱和时,反应速度趋于固定值分析分析Michaelis-Menten模型待定系数 =(1,2)基本模型 酶促反应的速度底物浓度第30页,此课件共43页哦数据分析数据分析v实验数据:散点图y 酶促反应速度x 底物浓度 xy0 1经嘌呤霉经嘌呤霉素处理素处理xy未经嘌呤未经嘌呤霉素处理霉素处理xyv模型mei.m mei1.m第31页,此课件共43页哦线性化模型v经嘌呤霉素处理后实验数据的估计结果参数估计值(10-3)置信区间(10-3)参数估计值15.1073.539 6.6761=1/1195.802720.2470.176 0.3192=2/10.04841R2=0.8557 F=5
18、9.2975 p=0.0000对1,2非线性 对1,2线性 mei3.m第32页,此课件共43页哦结果分析结果分析mei4.m x较大时,y有较大偏差 1/x较小时有很好的线性趋势,1/x较大时出现很大的起落 v线性化:参数估计时x较小(1/x很大)的数据控制了回归参数的确定v改进:非线性模型1/y1/xxy第33页,此课件共43页哦Matlab 统计分析统计分析vbeta的置信区间beta,R,J =nlinfit(x,y,model,beta0)3、回归分析:非线性statistics toolbox解释变量:矩阵模型函数参数估计值残差参数初值被解释变量:列预测误差的Jacobi矩阵bet
19、aci=nlparci(beta,R,J)第34页,此课件共43页哦Matlab 程序function y=f1(beta,x)y=beta(1)*x./(beta(2)+x);x=;y=;beta0=195.8027 0.04841;beta,R,J=nlinfit(x,y,f1,beta0);betaci=nlparci(beta,R,J);beta,betacif1.m mei5.m 212.6819197.2029 228.16090.06410.0457 0.0826 第35页,此课件共43页哦结果分析结果分析v最终反应速度为v半速度点(达到最终速度一半时的x值)为v效果参数参数估计
20、值估计值置信区间置信区间 1 1212.6819197.2029 228.1609 2 20.06410.0457 0.0826 o-o-原始数据原始数据+-+-拟合结果拟合结果 mei6.m 第36页,此课件共43页哦其它输出其它输出v给出交互画面给出交互画面v拖动画面的十字线,得拖动画面的十字线,得y的预测值和预测区间的预测值和预测区间v画面左下方的画面左下方的Export 输出其它统计结果。输出其它统计结果。v剩余标准差剩余标准差s=10.9337nlintool(x,y,model,beta)mei7.m 第37页,此课件共43页哦v在同一模型中考虑嘌呤霉素处理的影响在同一模型中考虑嘌
21、呤霉素处理的影响混合反应模型底物浓度底物浓度示性变量示性变量x2示性变量:示性变量:x2=1表示经过处理,表示经过处理,x2=0表示未经处理表示未经处理未经处理的最终反应速度未经处理的最终反应速度经处理后最终反应速度增长值经处理后最终反应速度增长值未经处理的反应的半速度点未经处理的反应的半速度点经处理后反应的半速度点增长值经处理后反应的半速度点增长值第38页,此课件共43页哦v用用nlinfit 和和 nlintool命令命令v参数初值:基于对数据的分析参数初值:基于对数据的分析Matlab 程序o 原始数据原始数据+拟合结果拟合结果 参数参数估计值估计值置信区间置信区间 1160.28021
22、45.8466 174.7137 20.04770.0304 0.0650 152.403532.4130 72.3941 20.0164-0.0075 0.0403经嘌呤霉素处理的作用不影响半速度点参数经嘌呤霉素处理的作用不影响半速度点参数未经未经处理处理经处理经处理估计结果和预测估计结果和预测置信区间包含零点,对因变量影响不显著置信区间包含零点,对因变量影响不显著第39页,此课件共43页哦简化混合模型简化混合模型v估计结果和预测o 原始数据原始数据+拟合结果拟合结果 未经未经处理处理经处理经处理v简化的混合模型形式简单v参数置信区间不含零点v剩余标准差 s=10.5851,比一般混合模型略
23、大 参数参数估计值估计值置信区间置信区间 1166.6025154.4886 178.7164 20.05800.0456 0.0703 142.025228.9419 55.1085第40页,此课件共43页哦v一般混合模型与简化混合模型预测比较结果分析结果分析实际值一般 简化6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.0478191190.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812v简化混合模型的预测区间较短,更为实用、有效第41页,此课件共43页哦v酶促反应评注评注注:非线性模型拟合程度的评价无法直接利用线性模型的方法,但R2 与s仍然有效。v反应速度与底物浓度的关系非线性关系v求解线性模型 求解非线性模型机理分析v嘌呤霉素处理对反应速度与底物浓度关系的影响混合模型 发现问题,得参数初值引入0-1变量简化模型 检查参数置信区间是否包含零点第42页,此课件共43页哦ENDEND第43页,此课件共43页哦
限制150内