企业文档信息管理系统设计与实现.docx
《企业文档信息管理系统设计与实现.docx》由会员分享,可在线阅读,更多相关《企业文档信息管理系统设计与实现.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、企业文档信息管理系统设计与实现企业文档信息管理系统的设计与实现 摘要:随着计算机技术的不断发展,电子档案管理在企业文档信息管理中越来越得到广泛的应用及普及。本文通过对。的分析,针对。的问题,提出了。的方法,运用。技术,设计与实现了一种企业文档信息管理系统。论文具体的论述了其探讨过程。关键词:档案管理,标准,电子管理系统,Lucene A study on multi-target tracking in intelligent monitoring system * Abstract:With the increasing development and application of comp
2、uter technology, file management is presenting the trend of information networking, management standardization, service industrialization. The wide application of multimedia boosts the emergence of electronic file management system. The system employs advanced technologies such as electric technical
3、 document, images digitization and paperless office to achieve the function of storage and retrieval of multimedia such as file, sound, image and document, which provides effective technical support for file management, application and protection, saves memory space, and prolongs the saving time of
4、file maintenance. Key words: file management, standardization, electronic management system, Lucene 1引论 作者简介:XXX(1980.10-)男,工程硕士,探讨方向:软件工程。 目前,国内的应用主要集中在政府(公共服务单位)、电信等行业内,而应用上主要体现在网站内容管理上与文档管理上,处于内容管理的初级阶段。 企业内容管理在内容上应当包括收集、格式转换、审核、分类、版本限制、内容测试、发布等处理的过程。而企业文档信息管理系统建设从整合企业信息资源的需求动身,重在提高效率,信息公开,充分利用计算
5、机和现代通讯手段面对企业服务,建立企业内部信息沟通的快速通道,共享信息资源,强化部门业务管理,加强各业务部门之间的沟通,实现企业信息的快速上传下达,促进协同办公,提高办公效率,为各级部门及业务人员供应协助办公和决策服务。企业机关的文档主要体现在上下级部门之间的收发文管理,数据量大、平安权限、流转过程限制要求很高。企业每天都会产生、接收、传递和处理大量的纸张文件。传统的文档管理方法须要大量的人员,足够的空间和设备费用,却不能供应牢靠的平安保障和满足的工作效率。所以文档的电子化、现代化管理也成为一种大趋势。在提高工作效率和平安性的同时,还须要保证系统的可扩展性和牢靠性。2 XXXXXXX的技术分析
6、 Lucene是一个全文搜寻框架,而不是搜寻应用产品。因此它并不像百度或者Google Desktop那样拿来就能用,它只是供应了一套工具让你能实现这些搜寻产品。Lucene能够为文本类型的数据建立索引,所以只要能把要索引的数据格式转化为文本,Lucene 就能对文档进行索引和搜寻。比如要对一些HTML文档,PDF文档进行索引的话,首先须要把 HTML 文档和 PDF 文档转化成文本格式的,然后将转化后的内容交给Lucene 进行索引,再把创建好的索引文件保存到磁盘或者内存中,最终依据用户输入的查询条件在索引文件上进行查询5。不指定要索引的文档的格式也使Lucene能够几乎适用于全部的搜寻应用
7、程序。搜寻应用程序和 Lucene 之间的关系,也反映了利用 Lucene构建搜寻应用程序的流程(参见图1 所示)。 图1搜寻应用程序和 Lucene 之间的关系 Fig1 relations between search application program and Lucene 索引是现代搜寻引擎的核心,建立索引的过程就是把源数据处理成特别便利查询的索引文件的过程。为什么索引这么重要呢,试想现在要在大量的文档中搜寻含有某个关键词的文档,那么假如不建立索引的话就须要把这些文档依次的读入内存,然后检查这个文章中是不是含有要查找的关键词,这样的话就会耗费特别多的时间,搜寻引擎可是在毫秒级的时间
8、内查找出要搜寻的结果的。这就是由于建立了索引的缘由,可以把索引想象成这样一种数据结构,他能够使你快速的随机访问存储在索引中的关键词,进而找到该关键词所关联的文档。 利用Lucene进行搜寻就像建立索引一样也是特别便利的。Lucene供应了几个基础的类来完成这个过程,它们分别是IndexSearcher, Term, Query, TermQuery, Hits。搜寻须要用到索引文件,索引文件是以一种倒排表的方式进行组织的,而倒排表的生成要依靠于分词。英文是以词为单位的,词与词之间运用空格进行分隔,所以分词比较简洁。中文是以字为单位的,一句话是由连在一起的字组成的。例如:英文的句子video s
9、earch engine,中文为视频搜寻引擎。计算机可以通过空格知道video是一个词,但是却不能干脆知道“视”和“频”的组合是一个词。把中文汉字序列切分成有意义的词就是中文分词。所以视频搜寻引擎的分词结果应当为“视频搜寻引擎”。正向最大匹配分词和逆向最大匹配分词都是基于词典的分词方法,所谓基于词典的分词是指要事先打算一个分词词典,分词词典中有大量的词,一般词典中词的数量在十几万到几十万不等。然后将待分词的句子根据肯定扫描规则与词典中的词进行匹配。假如匹配上就将这个词分出来。之所以称为最大匹配,就是要求每一句分词的结果中词汇的总量要最少。网络视频搜寻系统面对的是广阔的互联网用户,所以运用的用户
10、数量特别大,用户上传的视频节目数量特别多,所以随着数据量的增大和用户访问量的增加,就须要设计的搜寻引擎系统的性能要特别好,能够支撑特别高的并发访问恳求,同时系统能够特别简单地进行扩展,还必需具有较高的稳定性和可用性。所以,分布式的搜寻系统架构是一个搜寻引擎能否面对将来发展的关键因素。通过对已有的架构方案的优缺点进行了解和分析,提出一套新的更加简洁高效,具有较高的扩展性和易维护性的分布式搜寻引擎的架构。这样的架构能够更好得满意网络视频搜寻引擎的须要(其架构如图2所示)。 图2网络视频搜寻引擎架构 Fig2 search engine architecture of network video 3
11、系统需求分析与总体设计 依据系统设计方法,结合RUP(Rational Unified Process)软件开发的最佳实践,该系统的架构设计方法如参见图3所示。 图3架构设计方法示意图 Fig3 schematic diagram of this architecture 从图3中可以看出,系统的目标和任务是总体框架设计的动身点,它代表了系统的整体需求。主要依据系统目标和任务做架构设计,但在整个设计过程中须要全面分析IT系统现状,包括软件和硬件现状,因为IT系统现状对架构设计将产生肯定约束。从某种意义上讲,IT系统现状也是需求的一部分。同时约束架构设计的还有业务、技术发呈现状及趋势。 在会计档
12、案、业务档案、电子档案的处理过程中,将档案信息(例如:年份、密级等信息)采纳结构化数据的方式存储到数据库中。图像、电子文档、图纸等采纳非结构化数据存储到介质中。同时,在档案数据的生成、管理、查询、分析和利用等过程中采纳结构化数据和非结构化数据并存的方式,提高非结构化数据的利用不变问题。企业文档信息管理系统由档案管理子系统、组织管理子系统、库房管理子系统、出库入库管理子系统。通过这些系统,支撑企业的文档接收、整编、管理等实际应用(其应用架构参见图4中所示)。 图4 应用架构图 Fig4 architecture of file application 企业文档信息管理系统将建立成为一个对各种电子
13、文档和资料(Office文档、图形图像、音频视频、XML文档、历史文档、扫描的票据影像、数据库导出记录、其他文档)进行有效的组织管理和利用的应用软件系统,设计成敏捷、高效、平安的文档资料管理方案,使得用户能够以最敏捷的方式管理信息、最快的速度获得信息、最平安的手段运用信息,降低文档信息资料的管理、传递、运用的成本,规避因文档资料的遗漏和泄密所造成的风险。 为便于与业务系统集成,充分爱护用户的现有投资,企业文档信息管理系统完全基于业界成熟的J2EE架构平台,采纳JAVA、JSP、Servlet、Web Service、XML等编程技术,这种技术模式特别易于系统升级和向今后的先进技术实现迁移。企业
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业 文档 信息管理 系统 设计 实现
限制150内