数学模型之软件开发人员的薪金(共6页).doc
精选优质文档-倾情为你奉上软件开发人员的薪金问题 1.基本模型薪金y与资历,管理责任,教育程度,之间的多元线性回归模型为:其中,,是待估计的回归系数,是随机误差。利用MATLAB软件可以得到回归系数及其置信区间(置信水平=0.05),以及检验统计量,F,p的结果,具体算法如下,相应的结果见表一。1.1 具体算法x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 1 0'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346'x0=ones(46,1);x=x0 x1 x2 x3 x4;b,bint,r,rint,stats=regress(y,x,0.05);vpa(b,8)vpa(bint,8)vpa(stats,8)1.2运算结果图1.基本模型运算结果表一参数参数估计值置信区间a011033 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994-3826 -2162 a4148 -636 931 R2=0.9567 F=226 p=0 2.进一步讨论为了寻找改进的方向,常用残差分析方法,我们将影响因素分成资历与管理-教育组合两类,管理-教育组合的定义如表二。组合123456管理010101教育112233 表二下图2给出与资历的关系,图3给出与管理-教育,组合间的关系。图2. 基本模型与的关系 图3.与-,组合的关系附:残差图程序段:x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1'b,bint,r,rint,stats=regress(y,x,0.05);subplot(2,2,1)plot(x1,r,'r+')subplot(2,2,2)plot(x5,r,'b+')3.更好的模型增加与,的交互项后,模型记作利用MATLAB软件求解后的结果如下:图4.模型二运行结果 表三 作模型二的两个残差图(图5,图6)如下所示: 图5 图6附:残差图程序段:x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 1 0'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346'x0=ones(46,1);x=x0 x1 x2 x3 x4 x2.*x3 x2.*x4;b,bint,r,rint,stats=regress(y,x,0.05);vpa(b,8)vpa(bint,8)vpa(stats,8)subplot(2,2,1)plot(x1,r,'r+')subplot(2,2,2)plot(x5,r,'b+')4.去掉异常点的模型二去掉异常点后,对模型二重新估计回归系数,相应结果如下所示:图7.去掉异常点后模型二的运行结果表四参数参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2= 0.9998 F=36701 p=0 作去掉异常点后模型二的两个残差图(图8,图9)如下所示:图8 图9附:残差图程序段:x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 0 1 0 0 1 1 0 1 1 0 1 0'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 1 3 6 1 4 3 6 4 3 1 3 1'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346'x0=ones(45,1);x=x0 x1 x2 x3 x4 x2.*x3 x2.*x4;b,bint,r,rint,stats=regress(y,x,0.05);vpa(b,8)vpa(bint,8)vpa(stats,8)subplot(2,2,1)plot(x1,r,'r+')subplot(2,2,2)plot(x5,r,'b+')专心-专注-专业