装甲门工程项目数据分析与挖掘(工程管理).docx
《装甲门工程项目数据分析与挖掘(工程管理).docx》由会员分享,可在线阅读,更多相关《装甲门工程项目数据分析与挖掘(工程管理).docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、泓域咨询/装甲门工程项目数据分析与挖掘装甲门工程项目数据分析与挖掘xx(集团)有限公司一、 数据统计分析数据分析重要的一类是对具有随机性质的数据进行分析,在多数情况下是用于预测。本段仅介绍统计分析。统计分析不仅是计算样本的数字特征(期望值、方差、相关系数、协方差、离散度、概率分布等),还应当建立适当的模型,进而做出预测。统计分析一般有如下工作或阶段。1选择数字特征。统计分析,就是利用若干数字特征全面认识数据的统计规律。选择数字特征是统计分析研究问题的准备阶段,是统计过程的重要环节。数字特征应当:(1)能够客观地反映研究分析对象的性质、特点、内在联系和运动过程;(2)尽可能突出重点,反映分析对象
2、的全貌;(3)应能反映分析对象的变化;(4)便于资料获取。2收集并整理数据。确定了需用的数字特征之后,就要收集并整理所需的数据。样本的容量与质量对统计结果影响极大。3计算数字特征。利用整理后的样本计算必要的数字特征。这项工作可以同下面的建模合在一起,利用适当的软件进行。4建立模型。计算出样本数字特征后,应选择适合样本模式的模型。统计分析可用的模型很多,都有各自的特点及适用条件。选择模型时,应全面考虑研究对象与目的、到手的数据与资料、统计方法等各自的特点,以及咨询人员对方法的熟悉程度等。5检验模型误差。建模之后,可利用样本检验模型的误差,误差大小由样本与所选模型与方法所决定。根据经济学理论和研究
3、对象的具体特点,分析和评价模型误差,以及模型和方法本身;若误差未达到要求,应改进模型与方法。6利用模型预测。预测是咨询结论和建议的基本依据之一,应成为咨询及决策人员的高质量信息。7评价统计与预测结果。对统计与预测结果进行评价的任务是对初步统计结果(如离散程度、影响、走势等)进行概括,并寻找它们之间的联系。评价过程一般有:形成初步概念;对现象定性;提出主要观点;阐述所提观点的理由;提出论据;得出结论。咨询工程师在进行评价时,要在大局高度上全面、长远地看问题,多方面观察,不偏废任何一方;注意数据的衔接,当来源不同的数据矛盾时应弄清情况后再做取舍。二、 时间数据分析方法(一)时间数据时间数据也称时间
4、序列(Timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。(二)时间序列分析1概述时间序列分析是根据随机过程理论,研究时间序列的统计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油勘探、经营管理、预测(气象、水
5、文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参数根据按“最优预测”原则估算出的时间序列数字特征(期望值、方差、协方差、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节变动、规则波动和不规则波动。所
6、谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析确定时间序列各周期成分称为“谱”或“功率谱”的能量分布形态。频域分析又称谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的周期。3时间序列建模时间序列建
7、模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50的平稳时间序列,可用ARMA(自回归移动平均)模型拟合。非平稳时间序列可经差分化为平稳时间序列,再用ARMA模型拟合。(4)预测未来。利用建成的模型预测时间序列未来值。4时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 装甲 工程项目 数据 分析 挖掘 工程 管理
限制150内