《【数据模型与决策分析案例】.docx》由会员分享,可在线阅读,更多相关《【数据模型与决策分析案例】.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据模型与决策分析案例海外资金注入对于国内IT公司的影响目录数据模型与决策分析案例1海外资金注入对于国内IT公司的影响1案例背景1需解决问题1多元回归方程的优化1多元回归模型的检验2数据指标的选取4求解多元线性回归方程5总结11案例背景随着我国疫情逐步得到了缓解,在复工复产的大环境下,越来越多的海外企业开始将视 线移向了国内。目前,随着现在社会知识经济时代的到来,合资建厂对我国民营经济的推动 及外溢作用已越来越得到各国的广泛重视。大量文献研究表明,资金注入与经济增长是相辅 相承、相互制约的。据此,本文将以国内某IT企业为例,通过分析该企业与国外某IT公司 合作,通过合资建厂的方式引进高段技术,
2、培养技术人才,以此来论述外资诸如对该公司在 未来发展过程中是否具有一定的积极影响,并协助该公司做好企业决策。需解决问题技术人才是企业健康发展的基础,而资金注入,则可以对一家企业在战略转型升级上起 到积极的促进作用。据此,本文将通过多元线性回归模型来研究资金注入与经济增长之间的 关系,以国内某IT企业为例。文中选取该IT企业近十年的统计数据作,通过SPSS和MATLAB 软件利用多元逐步回归分析方法建立了经济增长指标与资金注入各因素之间的回归方程,并 进行了优化。利用优化回归方程对未来几年的经济增长与资金注入各因素进行预测。多元回归方程的优化对建立的全变量的回归方程Y = bo+blXl+b2X
3、2+b3X3+ +bmXm利用逐步回归方法进行最优方程的求解。剔除变量的方法有向前和向后两种常用方法。本文采用向后剔除法,其具体思路为:表12:误差分析模型平方和df均方Sig.回归61644020.8715411005.221104.0170.000残差83754.15813959.026总计61727775.03104 .预测变量:常量,Xa,X5,X6,X因变量:YAnova表中的/检验二 05,这表明多元线性回归模型显著。由表12中数据可得仍有变量的显著性水平高于05且X,的佥验数值显著性最高,故删除变量X,对剩余的、5,、6,进行线性回归分析。系数表如下:表 13: *5,乂6,乂7
4、 系数非标准化系数标准系数模型tSig.B标准误差试用版常量-1385.439323.824-4.2780.004x53.8530.9910.4003.8870.0061x60.0020.0000.6425.9490.001x70.0030.0010.1004.5830.003.因变量.Y .由表13得回归方程Ay = -1385.439 + 3.853x5 +0.002x6 +0.003x7下表为模型汇总:输出R、R方和调整R方。表14:模型汇总模型 RR2调整A?标准估计的误差10.9990.9980.997129.58490a .预测变量:常量,%5,6,%70表14的模型汇总给出了线性
5、回归的决定系数。R2 =0.998,说明该线性模型可以解释自变量99.8%的变差,拟合效果较好。表15:误差分析模型平方和df均方FSig.回归61610229.31320536743.101222.9900.0001残差117545.718716792.245总计61727775.0310a.预测变量:常量,、5,、6,、7。一因变量:YAr以表中的尸检验?=。.000.05,这表明多元线性回归模型显著。由表15中数 据可得已经没有显著性水平超过。5的自变量,故保留*5, 乂6, X。经过分析,选择海外资金投入对经济增长的预测方程为:;=-1385.439 + 3.853xs +0.002x
6、6 +0.003x7小、,。/(3)式中ygdp,万元;4IT增加值,万元;国外某IT公司用于资金支出,万元;X其他资金经费,万元。总结在当代社会中,人力资源越来越重要。目前,我国不少企业为了可以在今后的国际化战 略发展中取得一席之地,对于相关技术的学习,以及专业人才的引进也提上了日程。本文就 以我国某IT企业为例,通过分析其尝试性与海外企业合资建厂的方式来获取业内领先技术 与人才,得出了海外资金投入对经济增长的作用因素为:国外某IT公同用于资金支出、其 他资金经费以及IT增加值。国内某IT公司IT增加值每增加一个单位,GDP增加3.85万元。国外某IT公司用于资金支出每增加一个单位的投入,G
7、DP增加0.02万元。其他资金经费增加一个单位,GDP增加0.03万元。给定显著性水平为,当对所有回归系数进行显著性检验时,如果双侧概率则所得到的回归方程就是最优的。如果某一回归系数4对应的双侧概率PNa,则剔除变量X,。如果同时出现两个以上回归系数对应的双侧概率p-a,则此时需要先剔除双侧概率最 大对应的变量,然后进行下一轮的检3佥。多元回归模型的检验首先,是对多元线性回归预测模型进行/检验和t检验。决定系数R?记残差平方和SSE,ASSE = E(y-yi=记回归平方和SSR,A_SSR = E(yy)2/=,OSST = Z(XI/记总平方和SST,1 o三者的关系又称为“平方和分解”,
8、其表达式为SST = SSR + SSE,定义统计2 SSR SSE K = 1SST SST称之为回归方程的决定系数。由于 SSR SST,所以 0 W R21决定系数的大小反映了回归方程能够解释的响应变量总的变差比例,后的值越大,回 归方程的拟合程度越高。其次,是回归模型的显著性的P检验。SST反映因变量Y的波动程度或者不确定性。在建立了 丫对X的回归方程后,SST分解成SSR与SSE两部分。其中SSR是由回归方程确定的;SSE是不能由自变量X解释的变动,是由X之外的未加控制的因素引起的。这样,SS7中能够由自变量解释的部分为SSR,不能有自变量解 释的部分为SSE。这样的回归平方和越大,
9、回归的效果越好。据此,构造/检验统计量(下 式对多元回归也成立)如下:SSR口 p MSR回归均方一 SST- MSE残差均方 n-p-其中,平方和除以自己的自由度称为均方。SPSS在回归输出结果的ANOL4表中给出SSR, SSE,SST和尸统计量的取值,同时给出产值的显著性值(即值)。最后,是假设检验。1)常数项的7检验40:4=0检验统计量为统计量,其定义为At=AAse电)AA其中,se电)是。(常数项的估计值)的标准误差,即/统计量为常数项的估计值和 其标准误差的比值。SPSS回归分析的系数表中会给出回归方程常数项的估计值、标准误差、,统计量以及 相应的显著性值。2)回归系数显著性的
10、丁检验%:片=。检验统计量为/统计量,其定义为 AA“.(4)当成立时,我们有At = tn-p-)sc)其中,se(4)= V(4)为后(X的回归系数的估计值)的标准误差。SPSS回归分析的系数表中会给出回归参数的估计值、标准误差,,统计量以及相应的 显著性值。相关系数显著性的T检验%:。= 0该假设检验变量x变量y的相关系数是否等于o0SPSS在给出来两变量相关系数时,可以进行此项检验。检驹统计量为ry/n-2A - /一-产数据指标的选取海外资金投入是指一个外资企业,出于战略发展的需要,投入资金领域中的人力、物力 和财力的总和。本文选择国外某IT公司用于资金支出、资金固定资产投资、IT技
11、术人才数、基层员工、 资金经费、IT增加值、和其他资金经费作为海外资金投入因素,选择GDP作为经济增长变 量,并对海外资金投入七个因素进行多元逐步分析。设Y为GDP/万元Xi为资金固定资产投资,X2为IT技术人才数,X3为基层员工数, X4为资金经费,X5为IT增加值,X6为国外某IT公司用于资金支出,X7为其他资金经费。 样本数据取自中国统计年鉴,原始数据见表lo表1: 2011-2021年国内某IT公司相关指标数据表年份Y/万元Xix2x3x4x5x6x72011350070.64422141566029664.5831076.3214407.92012407081.83452276188
12、9645.3727.37979639.2248018.220134820.5394.944623211889645.3786.31180200248018.220145800.2583.84623692850048910.0218573008311520156971.05109.545240428500481060.422344001678320167655.18111.654624453333171.210992217897142749.320179451.26112.247249837765161206.982975000122580201811702.82106.347253244945
13、96.71294.753175331162523.9201912948.88137.844255663078661367.695036881.71053832020114338.5176.4250258878976071424.516220600118515求解多元线性回归方程利用SPSS软件依据多元回归方程的向后剔除法求解回归方程。首先运用SPSS对指标XI、X2、X3、X4、X5、X6、X7进行全变量线性回归分析,得到回归方程的回归系数见表2-1。“t”列是对应的估计值的T检验的T统计量的值。“Sig”列是对应的显著性值(产值)。表2为线性回归模型的参数估计。表2:相关系数展示非标准化系数
14、标准系数模型Sig.标准误差试用版常量-8043.5775595.953-1.4370.246Xi-42.00423.769-0.490-1.7670.175x235.91346.2020.0550.7770.494x31.4102.1710.0870.6490.562x4-0.0010.001-0.535-1.9410.148x514.9345.5951.5512.6690.076x60.0010.0010.3701.8690.158X70.0050.0010.1476.1220.158。.因变量:Y由表2得全变量的回归方程为:A=-8043.577-42.004%, +35.913x2 +
15、1.410x3 -0.001x4 +14.934x5 +0.00U6+0.005x7模型汇总中,给出了线性回归方程的决定系数。表3 :模型汇总模型R2调整后标准估计的误差1.0001.0000.998100.734634 .预测变量:常量,表3是模型汇总表。R2=l.000,表明该线性模型可以解释自变量100%的变差,说明回归方程的拟合效果 好。表4:误差分析模型平方和df均方FSig.回归61697332.6478813904.663868.5820.0001残差30442.397310147.466总计61727775.0310预测变量:常量,XX2,o氏因变量:丫Anova表中的尸检验二
16、 -05,这说明多元线性回归模型显著。由表2中数据可得仍有自变量的显著性水平为0.562高于0.05且的叶佥验数值显著 性最高,故删除自变量、3。对剩余的指标厂2,4,、5,、6,、7再进行回归分析。得到回归系数,见表5。表 5:Xi,X2,X4,Xs,X6,X7 的系数非标准化系数标准系数模型B标准误差试用版tSig,常量-4846.5872460.600-1.9700.120Xi-33.66918.503-0.393-1.8200.143x230.37941.9990.0460.7230.5101 x4-0.0010.001-0.432-2.0700.107x513.5484.7841.4
17、072.8320.047x60.0010.0010.4132.3850.076x70.0050.0010.1476.6100.003模型非标准化系数标准系数试用版tSig.B标准误差常量-4846.5872460.600-1.9700.120X1-33.66918.503-0.393-1.8200.143x230.37941.9990.0460.7230.510x4-0.0010.001-0.432-2.0700.107x513.5484.7841.4072.8320.047x60.0010.0010.4132.3850.076x70.0050.0010.1476.6100.003.因变量:Y
18、由表5得指标X ,、2,、4,、5,、6, X的回归方程为:Ay= -4846.587-33.669 + 30.379x2 -0.00 lx4 +13.548x5 +0.00 lx6 +0.005x7-o对模型进行拟合优度表6:模型汇总模型 RR2调整R2标准估计的误差11.0000.9990.99993.16868Q .预测变量:常量,%1,%2,%4,%5,%6,%70表6的模型汇总表给出了线性回归方程的决定系数。R-=0999,说明该线性模型可以解释自变量99.9%的变差,拟合效果好。表7 :误差分析模型平方和df均方FSig.回归61693053.42610282175.571184.
19、5280.0001残差34721.60848680.402总计61727775.0310a,预测变量:常量,*, X?, X, %5应*。氏因变量:YAnova表中的尸检验二 -05,这说明多元线性回归模型显著。由表7中数据可得仍有变量的显著性水平高于005且乂2的叶佥3佥数值显著性最高,故 删除变量、2。对剩余%,%4,%5,%6,%7的进行线性回归分析。下为系数表。表 8:X,X4,Xs,X6,X7系数非标准化系数标准系数模型B标准误差试用版tSig.常量-3146.024690.667-4.5550.006X1-22.3499.389-0.261-2.3800.063x4-0.0010.
20、000-0.301-3.0540.0281x510.7442.6661.1164.0310.010x60.0010.0000.4873.6630.015x70.0050.0010.1456.9080.001”.因变量:y由表8得指标X , X4,、5,、6, X的回归方程为(=%-0.00 支4+10.744%+0.。056+0.。05七表42模型汇总模型 RR2调整尺2标准估计的误差11.0000.9990.99988.61522预测变量:常量,乂】*4*5,6,7。表8为模型汇总表。氏2二0.999,说明该线性模型可以解释自变量99.9%的变差,拟合效果好。表9:误差分析模型平方和df均方
21、FSig.1回归61688511.74512337702.351571.1500.000残差 39263.28757852.657总计61727775.0310a.预测变量:常量,Xi,X4,X5,X6,X。.因变量:yAnova表中的/检验二 05,这表明多元线性回归模型显著。由表9中数据可得仍有变量的显著性水平高于005且X|的1检验数值显著性最高,故 删除变量用。对剩余的、4,、5,、6, X1进行线性回归分析。系数表如下:表 10:乂4,乂5,乂6,乂7 系数非标准化系数标准系数模型B标准误差试用版tSig.常量-1610.376328.741-4.8990.003x40.0000.000-0.169-1.5560.171x54.6821.0490.4864.4630.004x60.0020.0000.7306.4350.001x70.0040.0010.1145.2160.002.因变量:Y由表1。得回归方程Ay = -1610.376 + 0.000x4+ 4.682x5 +0.0026 +0.004x7表11 :模型汇总模型 RR2调整改标准估计的误差10.9990.9990.998118.14832”.预测变量:常量,%4,%5,%6,%70表11的模型汇总给出了线性回归的决定系数。R2 =0.999,说明该线性模型可以解释自变量99.9%的变差,拟合效果较好。
限制150内