《岩棉复合板工程项目数据分析与挖掘(工程项目管理).docx》由会员分享,可在线阅读,更多相关《岩棉复合板工程项目数据分析与挖掘(工程项目管理).docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、泓域咨询/岩棉复合板工程项目数据分析与挖掘岩棉复合板工程项目数据分析与挖掘xx集团有限公司一、 项目名称及项目单位项目名称:岩棉复合板工程项目项目单位:xx集团有限公司二、 项目建设地点本期项目选址位于xx园区,占地面积约81.00亩。项目拟定建设区域地理位置优越,交通便利,规划电力、给排水、通讯等公用设施条件完备,非常适宜本期项目建设。三、 建设规模该项目总占地面积54000.00(折合约81.00亩),预计场区规划总建筑面积95311.60。其中:主体工程59136.48,仓储工程20194.92,行政办公及生活服务设施9577.96,公共工程6402.24。四、 项目建设进度结合该项目建
2、设的实际工作情况,xx集团有限公司将项目工程的建设周期确定为24个月,其工作内容包括:项目前期准备、工程勘察与设计、土建工程施工、设备采购、设备安装调试、试车投产等。五、 建设投资估算(一)项目总投资构成分析本期项目总投资包括建设投资、建设期利息和流动资金。根据谨慎财务估算,项目总投资43002.71万元,其中:建设投资32420.03万元,占项目总投资的75.39%;建设期利息910.23万元,占项目总投资的2.12%;流动资金9672.45万元,占项目总投资的22.49%。(二)建设投资构成本期项目建设投资32420.03万元,包括工程费用、工程建设其他费用和预备费,其中:工程费用2856
3、5.07万元,工程建设其他费用3028.32万元,预备费826.64万元。六、 项目主要技术经济指标(一)财务效益分析根据谨慎财务测算,项目达产后每年营业收入89100.00万元,综合总成本费用71623.53万元,纳税总额8274.84万元,净利润12784.86万元,财务内部收益率22.67%,财务净现值20866.58万元,全部投资回收期5.83年。(二)主要数据及技术指标表主要经济指标一览表序号项目单位指标备注1占地面积54000.00约81.00亩1.1总建筑面积95311.60容积率1.771.2基底面积32400.00建筑系数60.00%1.3投资强度万元/亩398.802总投资
4、万元43002.712.1建设投资万元32420.032.1.1工程费用万元28565.072.1.2工程建设其他费用万元3028.322.1.3预备费万元826.642.2建设期利息万元910.232.3流动资金万元9672.453资金筹措万元43002.713.1自筹资金万元24426.543.2银行贷款万元18576.174营业收入万元89100.00正常运营年份5总成本费用万元71623.536利润总额万元17046.487净利润万元12784.868所得税万元4261.629增值税万元3583.2310税金及附加万元429.9911纳税总额万元8274.8412工业增加值万元2732
5、4.3013盈亏平衡点万元34641.75产值14回收期年5.83含建设期24个月15财务内部收益率22.67%所得税后16财务净现值万元20866.58所得税后七、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是
6、数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结
7、果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业
8、数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否
9、可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从WWW中发现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过
10、归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了Robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态Web页面,最后获取被访问站点网络数据库中的动态信息,生成WWW资源
11、索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。八、 时间数据分析方法(一)时间数据时间数据也称时间序列(Timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。(二)时
12、间序列分析1概述时间序列分析是根据随机过程理论,研究时间序列的统计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油勘探、经营管理、预测(气象、水文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参数根据按
13、“最优预测”原则估算出的时间序列数字特征(期望值、方差、协方差、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节变动、规则波动和不规则波动。所谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析确定时间
14、序列各周期成分称为“谱”或“功率谱”的能量分布形态。频域分析又称谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的周期。3时间序列建模时间序列建模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50的平稳时
15、间序列,可用ARMA(自回归移动平均)模型拟合。非平稳时间序列可经差分化为平稳时间序列,再用ARMA模型拟合。(4)预测未来。利用建成的模型预测时间序列未来值。4时间序列常用模型(1)ARMA模型(2)回归模型九、 层次分析法概述及优缺点(一)层次分析法概述层次分析法(简称AHP)是美国匹茨堡大学运筹学家T.L.satty教授于20世纪70年代初,在为美国国防部研究“应急计划”时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。该方法将决策问题的有关元素分解成目标、准则、方案等层次,在此基础上进行定性分析和定量分析的一种决策方法。这一方法的特点,是在对复杂决策问题的本质影
16、响因素及其内在关系等进行深人分析之后,构建一个层次结构模型,然后利用较少的定量信息,把决策的思维过程数学化,从而为求解多准则或无结构特性的复杂决策问题提供一种简便的综合决策分析方法。层次分析法的应用范围十分广泛,应用的领域包括:经济与计划;能源政策与资源分配;政治问题及冲突;人力资源管理;教育发展;医疗卫生;环境工程;军事指挥与武器评价;企业管理与生产经营决策;项目评价;规划咨询;资源环境承载力评价等。层次分析法优缺点1层次分析法的优点(1)系统性的分析方法层次分析法把研究对象作为一个系统,按照分解、比较判断、综合的思维方式进行决策,成为继机理分析、统计分析之后发展起来的系统分析的重要工具。系
17、统的思想在于不割断各个因素对结果的影响,层次分析法中每一层的权重设置最后都会直接或间接影响到结果,而且在每个层次中的每个因素对结果的影响程度都是量化的,非常清晰明确。(2)简洁实用的决策方法这种方法既不单纯追求高深数学,又不片面地注重行为、逻辑、推理,而是把定性方法与定量方法有机地结合起来,将多目标、多准则又难以全部量化处理的决策问题化为多层次单目标问题,通过两两比较确定同一层次元素相对上一层次元素的数量关系后,最后进行简单的数学运算。该方法计算简便,结果明确,且易于决策者了解和掌握。(3)所需定量数据信息较少层次分析法主要是从评价者对评价问题的本质、要素的理解出发,比一般的定量方法更讲究定性
18、的分析和判断。由于层次分析法是一种模拟人们决策过程的思维方式的一种方法,该方法把判断各要素的相对重要性化为简单的权重进行计算。2层次分析法的缺点(1)不能为决策者提供新方案对于大部分决策者来说,如果一种分析方法能替我们分析出在我们已知的方案里的最优者,然后能指出已知方案的不足,或者甚至能提出改进方案的话,这种分析方法才是比较完美的。而层次分析法只能从原有备选方案中选择较优者,而不能为决策者提供解决问题的新方案。(2)指标过多时工作量大,且权重难以确定当我们希望能解决较普遍的问题时,指标的选取数量很可能也就随之增加,而指标的增加就意味着我们要构造层次更深、数量更多、规模更庞大的判断矩阵,那么就需
19、要对许多的指标进行两两比较的工作。由于一般情况下两两比较是用1至9来说明其相对重要性,如果有越来越多的指标,对每两个指标之间的重要程度的判断可能就会出现困难,甚至会对层次单排序和总排序的一致性产生影响,使一致性检验不能通过,如果不能通过,就需要进行调整,在指标数量多的时候其调整的工作量大,且权重难以确定。(3)特征值和特征向量的精确求法比较复杂在求判断矩阵的特征值和特征向量时,所用的方法和我们多元统计所用的方法是一样的。在二阶、三阶的时候,还比较容易处理,但随着指标的增加,阶数也随之增加,其人工计算也变得越来越困难,需要借助计算机来完成。十、 项目背景分析岩棉复合板是在岩棉板的基础上增加了水泥抹面,使岩棉板在安装使用中工期缩短70%,有效的提高了工程进度。岩棉复合板的主体材质是玄武岩棉板,玄武岩、铁矿石、铝矾土等为主要原料,经过高温融熔加工加入适量粘结剂成的人工无机纤维,具有质量轻、导热系数小、吸热、不燃的特点。岩棉复合板是在岩棉板的基础上增加了水泥砂浆抹面,加固了岩棉板的硬度,直接省去了施工时上墙抹灰的过程,使岩棉板在安装使用中工期缩短70%,岩棉板是以玄武岩及其它天然矿石等为主要原料,岩棉板经高温熔融成纤,加入适量粘结剂,固化加工而制成的。岩棉板产品适用于工业设备、建筑、船舶的绝热、隔音等。
限制150内