锆石工程项目数据采集分析与知识管理(工程项目组织与管理).docx
《锆石工程项目数据采集分析与知识管理(工程项目组织与管理).docx》由会员分享,可在线阅读,更多相关《锆石工程项目数据采集分析与知识管理(工程项目组织与管理).docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、泓域咨询/锆石工程项目数据采集分析与知识管理锆石工程项目数据采集分析与知识管理xxx有限公司一、 SWOT分析法模型SWOT分析基于内外部竞争环境和竞争条件下的态势分析,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论。运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而根据研究结果制定相应的发展战略。根据优势、劣势与机会、威胁两两组合,SWOT分析可以形成SO、WO、ST、wT四种不同类型的组合战略。SO战略(优势一机会):是一种发展企业
2、内部优势与利用外部机会的战略,是种理想的战略模式。当企业具有特定方面的优势,而外部环境又为发挥这种优势提供有利机会时,可以采取该战略。WO战略(劣势一机会):是利用外部机会来弥补内部劣势,使企业改劣势而获取优势的战略。存在外部机会,但由于企业存在一些内部劣势而妨碍其利用机会,可采取措施先克服这些劣势。ST战略(优势一威胁):是指企业利用自身优势,回避或减轻外部威胁所造成的影响。WT战略(劣势一威胁):是一种旨在减少内部劣势,回避外部环境威胁的防御性技术。SWOT分析法在应用于企业发展战略制定时,首先应根据企业优劣势分析和机会威胁分析,画出SWOT分析图,然后根据SWOT分析结果,在SWOT分析
3、图上找到企业相应的位置,从而进行相应的战略选择。SWOT分析图划分为4个象限,根据企业所在的不同位置,应采取不同的战略。SWOT提供了4种战略选择:在右上角的企业拥有强大的内部优势和众多的机会,企业应采取增加投资、扩大生产、提高市场占有率的增长性战略;在右下角的企业尽管具有较大的内部优势,但必须面临严峻的外部挑战,应利用企业自身优势,开展多元化经营,避免或降低外部威胁的打击,分散风险,寻找新的发展机会;处于左上角的企业,面临外部机会,但自身内部缺乏条件,应采取扭转性战略,改变企业内部的不利条件;处于左下角的企业既面临外部威胁,自身条件也存在问题,应采取防御性战略,避开威胁,消除劣势。二、 数据
4、统计分析数据分析重要的一类是对具有随机性质的数据进行分析,在多数情况下是用于预测。本段仅介绍统计分析。统计分析不仅是计算样本的数字特征(期望值、方差、相关系数、协方差、离散度、概率分布等),还应当建立适当的模型,进而做出预测。统计分析一般有如下工作或阶段。1选择数字特征。统计分析,就是利用若干数字特征全面认识数据的统计规律。选择数字特征是统计分析研究问题的准备阶段,是统计过程的重要环节。数字特征应当:(1)能够客观地反映研究分析对象的性质、特点、内在联系和运动过程;(2)尽可能突出重点,反映分析对象的全貌;(3)应能反映分析对象的变化;(4)便于资料获取。2收集并整理数据。确定了需用的数字特征
5、之后,就要收集并整理所需的数据。样本的容量与质量对统计结果影响极大。3计算数字特征。利用整理后的样本计算必要的数字特征。这项工作可以同下面的建模合在一起,利用适当的软件进行。4建立模型。计算出样本数字特征后,应选择适合样本模式的模型。统计分析可用的模型很多,都有各自的特点及适用条件。选择模型时,应全面考虑研究对象与目的、到手的数据与资料、统计方法等各自的特点,以及咨询人员对方法的熟悉程度等。5检验模型误差。建模之后,可利用样本检验模型的误差,误差大小由样本与所选模型与方法所决定。根据经济学理论和研究对象的具体特点,分析和评价模型误差,以及模型和方法本身;若误差未达到要求,应改进模型与方法。6利
6、用模型预测。预测是咨询结论和建议的基本依据之一,应成为咨询及决策人员的高质量信息。7评价统计与预测结果。对统计与预测结果进行评价的任务是对初步统计结果(如离散程度、影响、走势等)进行概括,并寻找它们之间的联系。评价过程一般有:形成初步概念;对现象定性;提出主要观点;阐述所提观点的理由;提出论据;得出结论。咨询工程师在进行评价时,要在大局高度上全面、长远地看问题,多方面观察,不偏废任何一方;注意数据的衔接,当来源不同的数据矛盾时应弄清情况后再做取舍。三、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。
7、大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析
8、的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评
9、估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存
10、入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据
11、预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从WWW中发现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了Robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目
12、标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态Web页面,最后获取被访问站点网络数据库中的动态信息,生成WWW资源索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。四、 信息鉴别常用方法(一)溯源法对到手信息涉及的问题应追根溯源,及时核对。例如,尽量找到现场和掌握第一手资料的人;核对原始资料,并查对主要参考文献;按其中叙述的方法、步骤,重做实验或演算,以便从来
13、源上找到鉴别依据。鉴别和筛选在手信息,判断是否完整、适用与可靠,是咨询人员的重要工作。工程咨询所需信息十分广泛,不可能也不必均由咨询人员鉴别。为了确保信息可靠,应尽可能选用权威机构发布或已鉴定、批准的信息。例如,地质储量选用储量委员会批准的储量报告;地震带的分布用国家地震局的数据;历史数据用国家统计局的数据。一般来说,专业技术力量强的单位提供的信息较可靠。例如,国际金融组织的国际金融信息较可靠;来自从事钢铁、汽车行业研究的机构的钢铁、汽车业信息较可靠。(二)比较法有些信息受主客观条件限制难以溯源,对此,可用比较法,即比较不同人、不同时间和其他方面的材料;对于某一事实,说法、结论是否一致。如果一
14、致,则基本可辨真伪。若否,就需进一步核查。(三)佐证法任何事物都与其他事物有一定联系,并相互制约。找到这些联系和制约因素,便可判断事物的真伪。一般说来,口头材料不如文字材料可靠,文字不如实物可靠。分析信息产生的过程也是寻求信息佐证的办法。1普查数据一般比抽查数据全面、准确。2监测数据,长期比短期全面,监测范围大的数据比监测范围小的数据代表性强;勘探密度大的数据比勘探密度小的数据准确,科学实验和仿真模拟计算的数据比一般推理的数据准确。3核对来源不同,收集方法不同的数据。如卫星图片、航测数据可用地面实测数据验证;了解来的市场需求量与行业协会、主要企业、国家统计局的数据对比。4对比不同时期、不同来源
15、的数据,并适当修正其间的差距。同一对象的数据,在不同国家、不同历史时期,由于范围不同,计算的标准和口径可能有所不同,造成数据之间有很大的差异。在对比这些数据时,必须查明统计口径,否则就会出错。5由专家集体辨别信息是否准确,是否可靠。对于来自不同渠道的信息,可能因角度不同、口径不一、方法各异等而不一致,甚至矛盾。这时,可请专家集体讨论,弄清差异和矛盾的原因,去伪存真,取得一致意见。(四)逻辑法鉴别信息,逻辑判断必不可少。不经缜密的逻辑思考容易出错。有些基本差错,例如语言或文字的前后矛盾,夸大其词,有悖情理,以及某些虚构,禁不起逻辑的推敲。当然,逻辑合理并不总能证明事物为真,从虚假的前提出发,经过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 石工 项目 数据 采集 分析 知识 管理 工程项目 组织
限制150内