数学建模:统计模型.ppt
《数学建模:统计模型.ppt》由会员分享,可在线阅读,更多相关《数学建模:统计模型.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1建立实际回归模型的过程建立实际回归模型的过程实际问题实际问题设置指标变量设置指标变量 解释变量的重要性;不相关性;用相近的变量代替或几个指标复合;个数适当这个过程需反复试算收集整理数据收集整理数据 时间序列数据:随机误差项的序列相关,如人们的消费习惯 横截面数据:随机误差项的异方差性,如居民收入与消费 样本容量的个数应比解释变量个数多 缺失值,异常值处理构造理论模型构造理论模型 绘制 yi 与 xi 的样本散点图,如生产函数、投资函数、需求函数估计模型参数估计模型参数最小二乘,偏最小二乘,主成分回归等,依靠软件.模型检验模型检验统计检验和模型经济意义检验,从设置指标变量修改模型运用模型运用
2、经济因素分析、经济变量控制、经济决策预测2线性回归实例选讲牙膏的销售量线性回归实例选讲牙膏的销售量 1. 问题问题建立建立牙膏销售量与价格、广告投入之间的牙膏销售量与价格、广告投入之间的模型模型;预测预测在不同价格和广告费用下的牙膏在不同价格和广告费用下的牙膏销售量销售量. 收集了收集了30个销售周期本公司牙膏销售量、价格、个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价广告费用,及同期其他厂家同类牙膏的平均售价 .9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.
3、503.803.851销售量销售量(百万支百万支)价格差价格差(元)(元)广告费用广告费用(百万元百万元)其他厂家其他厂家价格价格(元元)本公司价本公司价格格(元元)销售销售周期周期3 确定关系:确定关系: 牙膏销售量牙膏销售量价格、广告投入价格、广告投入 内部规律复杂内部规律复杂数据统计分析数据统计分析 常用模型常用模型回归模型回归模型数学原理数学原理软件软件 30个销售周期数据:个销售周期数据: 销售量、价格、广告费用、同类产品均价销售量、价格、广告费用、同类产品均价销售周期 公司价 (元) 它厂价 (元) 广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3
4、823.754.006.750.258.51293.803.855.800.057.93303.704.256.800.559.2642. 基本模型基本模型011yx201222yxx 55.566.577.577.588.599.510 x2y-0.200.20.40.677.588.599.510 x1yv y 公司牙膏销售量v x1其它厂家与本公司价格差v x2公司广告费用解释变量(回归变量, 自变量) 被解释变量(因变量) v 多元回归模型多元回归模型22322110 xxxy5MatlabMatlab 统计分析统计分析 rcoplot(r,rint) 残差残差及其及其置信区间作图置信
5、区间作图 MATLAB7.0版本版本 s增加一个统计量增加一个统计量: 剩余方差剩余方差s2b , bint , r , rint , stats = regress( y , X , alpha )statistics toolbox01 122nnyxxx解释变量:矩阵显著性水平:0.05 系数 估计值 置信区间 残差向量向量y-xb 置信区间 被解释变量:列检验统计量:R2,F,p 随机误差:正态分布均值为零回归系数x=1 2221xxx3. 模型求解模型求解由数据由数据 y,x1,x2估计估计 x=ones(size(x1),x1,x2,x2.2;b,bint,r,rint,stats
6、=regress(y,x)程序程序64. 结果分析结果分析参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p0.0001 s2=0.0490 0 1 2 320112232yxxx , 故故x22项显著项显著 但可将但可将x2保留在模型中保留在模型中 v 即:即:212217.32 1.313.700.35yxxxy的的90.54%可由模型确定、可由模型确定、 F远超过远超过F检验的临界检验的临
7、界值、值、 p远小于远小于 =0.05v 显著性显著性 :整体显著:整体显著v x2 : 2 置信区间包含零点置信区间包含零点, 但右端点距零点很近但右端点距零点很近 x2 对因变量对因变量 y 的影响不太显著;的影响不太显著;v 3 显著显著7v 控制价格差控制价格差 x1=0.2元,投入广告费元,投入广告费 x2=6.5 百万元百万元销售量预测区间为销售量预测区间为 7.8230,8.7636(置信度(置信度95%)上限用作库存管理的目标值上限用作库存管理的目标值 下限用来把握公司的现金流下限用来把握公司的现金流 v 若估计若估计 x3=3.9,设定,设定 x4=3.7201122328.
8、2933yxxx (百万支百万支)销售量预测销售量预测22322110 xxxy价差价差x1=它厂价它厂价x3-公司价公司价x4估计估计x3,调整,调整x4控制控制x1预测预测yv 得得 则可以则可以 95%的把握知道销售额在的把握知道销售额在 7.8320 3.7 29(百万(百万 元)以上元)以上85. 模型改进模型改进x1和和x2对对y的的影响独立影响独立 20112232yxxx 20112232412yxxxx x 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077
9、0.34860.0379 0.6594 R2=0.9054 F=82.9409 p0.0001 s2=0.0426 0 1 2 3参数参数参数估计值参数估计值置信区间置信区间29.113313.7013 44.525211.13421.9778 20.2906 -7.6080-12.6932 -2.5228 0.67120.2538 1.0887 -1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p0.0001 s2=0.0490 3 0 1 2 4x1和和x2对对y的影响有的影响有交互作用交互作用比较:比较:置信区间置信区间, R29比较比较: 两模型销售
10、量预测两模型销售量预测v控制价格差控制价格差 x1=0.2 元,投入广告费元,投入广告费 x2=6.5 百万元百万元21422322110 xxxxxy22322110 xxxy2933.8 y(百万支百万支)区间区间 7.8230,8.7636区间区间 7.8953,8.7592 3272.8 y(百万支百万支)预测区间长度更短预测区间长度更短 略有增加略有增加 y 10 x2=6.5x1=0.2 -0.200.20.40.67.588.59x1y -0.200.20.40.67.588.59x1y 56787.588.599.510 x2y 567888.599.51010.5x2y 20
11、112232 yxxx 20112232412 yxxxx x 6. 比较比较:两模型两模型 与与x1, x2的关系的关系y 11讨论:交互作用影响讨论:交互作用影响 价格差价格差 x1=0.1 价格差价格差 x1=0.32221 . 06712. 07558. 72267.301xxyx2223 . 06712. 00513. 84535.321xxyx21422322110 xxxxxy5357. 72x广告投入广告投入y ( x2大于大于6百万元)百万元)价格差较小时价格差较小时增加的速率更大增加的速率更大 56787.588.599.51010.5x1=0.1x1=0.3x2y 1 .
12、 03 . 011xxyy价格优势价格优势y 价格差较小价格差较小广告作用大广告作用大x1x22122214777. 16712. 06080. 71342.11133.29xxxxxy12多元二项式回归多元二项式回归命令:rstool(x,y,model, alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量13完全二次多项式模型完全二次多项式模型 22521421322110 xxxxxxyMATLAB中有命令中有命令rstool直接求解直接求解00.20.47.588.599.5105.566.57y ),(543210从输出从输出 Export 可得可得鼠标移动十字线鼠标移动十
13、字线(或下方窗口输入或下方窗口输入)可改变可改变x1, x2, 左边窗口左边窗口显示预测值显示预测值 及预测区间及预测区间y Rstool(x,y,model,alpha,xname,yname)14牙膏的销售量牙膏的销售量 建立统计回归模型的基本步骤建立统计回归模型的基本步骤 根据已知数据从常识和经验分析根据已知数据从常识和经验分析, 辅之以作图辅之以作图, 决定回归变量及函数形式决定回归变量及函数形式(先取尽量简单的形式先取尽量简单的形式). 用用软件软件(如如MATLAB统计工具箱统计工具箱)求解求解. 对结果作对结果作统计分析统计分析: R2,F, p, s2是对模型整体评价是对模型整
14、体评价, 回归系数置信区间是否含零点检验其影响的显著性回归系数置信区间是否含零点检验其影响的显著性. 模型改进模型改进, 如增添二次项、交互项等如增添二次项、交互项等. 对因变量进行对因变量进行预测预测.15非线性回归实例选讲酶促反应非线性回归实例选讲酶促反应 问问题题研究酶促反应(酶催化反应)中研究酶促反应(酶催化反应)中嘌呤霉素嘌呤霉素(处理与否处理与否)对反应速度与底物(反应物)浓对反应速度与底物(反应物)浓度之间关系的影响度之间关系的影响. 酶促反应酶促反应 由由酶作为酶作为催化剂催化剂催化进行的催化进行的化学反应化学反应 生物体生物体内的化学反应绝大多数属于酶促反应内的化学反应绝大多
15、数属于酶促反应 酶促反应中酶作为高效催化剂使得反应以极快的速度酶促反应中酶作为高效催化剂使得反应以极快的速度(1031017倍)或在一般情况下无法反应的条件下进行倍)或在一般情况下无法反应的条件下进行 酶是生物体内进行各种化学反应最重要的因素酶是生物体内进行各种化学反应最重要的因素16 建立数学模型,反映该酶促反应的速度与底物建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系浓度以及经嘌呤霉素处理与否之间的关系 设计了两个实验设计了两个实验 酶经过嘌呤霉素处理酶经过嘌呤霉素处理 酶未经嘌呤霉素处理酶未经嘌呤霉素处理 实验数据实验数据:底物浓度底物浓度(ppm(ppm)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 统计 模型
限制150内