2022年全文检索产品白皮书 .pdf
《2022年全文检索产品白皮书 .pdf》由会员分享,可在线阅读,更多相关《2022年全文检索产品白皮书 .pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 1 页 / 共 12 页全文检索产品白皮书北京线点科技有限公司二零一一年名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 2
2、 页 / 共 12 页目录一系统概述 . 31.关于线点 . 32.产品概述 . 4二技术框架 . 5三产品功能 . 7四系统特点 . 81.多操作系统、多平台、多数据库支持. 82.支持多数据源检索. 83.智能化的检索服务. 84.海量数据高效处理. 85.中文分词技术. 96.搜索结果多样化展现方式. 97.支持多种语言开发接口,与网站无缝集成 . 98.完善的非结构化数据管理. 99.提供丰富检索语法. 910.拼音检索与概念检索. 1011.索引自动检测与修复. 1012.高可用系统负载均衡/集群 . 1013.数据加密与数据传输安全SSL/LDAP. 1014.分布式系统支持. 1
3、115.操作简易、维护方便. 11五系统硬件要求. 11六性能指标 . 11名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 3 页 / 共 12 页一 系统概述1. 关于线点线点科技是国内领先的企业内容管理解决方案供应商,为中关村高新技术和国家双软认证企业 ,并通过了 ISO
4、9001质量管理体系认证, 在金融、电信、政府、IT、教育等众多行业拥有良好的声誉和品牌影响力。线点科技的技术研发中心拥有众多的搜索引擎领域专业人才,致力于搜索引擎技术及相关产品的研发,以企业内容管理应用为导向,以全文检索、搜索引擎、中文语言知识处理三大核心技术,为客户提供优质专业的产品、服务和解决方案。线点科技拥有一支朝气向上、具有创新拼搏精神的团队。通过多年的努力,客户遍布全国各地,其中有多个世界五百强企业,及国内主要的软件厂商和集成商,主要客户包括摩托罗拉、诺基亚、宝马中国、中国移动、上海市知识产权局、中国船级社、江苏省公安厅、广东省公安厅、用友软件、宝信软件、港澳资讯、中投证券、赶集网
5、等。线点科技的公司理念是“人才为本,科技为先”,坚持“品质第一 ,服务至上”的服务宗旨,以创新实干的姿态,高效而团结的精神,凭借多年累积的技术实力及丰富的经验,为每一个客户提供专业、贴切、快捷、规范的服务。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 4 页 / 共 12
6、页2. 产品概述XDFullsearch是线点科技于 2005年即开始研发的一个强大的,高性能的 JAVA企业级搜索引擎产品,在线点的企业级搜索平台上,你可以搜索出你企业所有相关的内容包括网站、邮箱、ECM, CRM。XDFullsearch 使用一种新的模式来实现分布式和集群功能, 通过扩展计算能力,能够支持上千G 文档,完成复杂的并行运算,提高系统的可用性。它支持超过15 种语言的多语言搜索,能够集成文档自动分类和聚类功能。可以通过采集器为索引库定制数据来源,采集器通过插件的方式扩展。默认提供数据库、邮件、本地文件系统、网络文件系统、FTP、Domino、各类数据库、 Access的采集器
7、。 XDFullsearch 通过作业调度系统实现了任务的自动化采集、能够增量索引,支持数据更新,能够通过可视化的方式对索引字段进行管理。XDFullsearch 能够很容易的集成Hadoop 和HBase。此外它还开发多种编程语言的API 包括: JSP 、PHP、Java 、Python、C#等等。在六年的产品销售和完善过程中,XDFullsearch 可以在各种复杂的网络和应用环境中工作, 当前,XDFullsearch 在国内的装机量已经达到了5000 台服务器以上,总数据量在20PB(1PB=1000T)以上,有 20 家以上世界五百强客户,有2000家以上企业 /政府客户选择使用线
8、点的XDFullsearch 产品。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 5 页 / 共 12 页二 技术框架系统体系架构在 XDFullSearch 的应用模型中, 主要是在数据层 (数据库、文档和各种数据源)与业务应用层建立了一个索引数据结构,将各种数据在索引中
9、建立隐射,而业务系统通过调用接口访问索引,来实现对底层数据的访问,调用等等。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 6 页 / 共 12 页系统技术架构从上图中可以看到,线点科技全文检索产品构建于J2EE 平台,继承了它跨平台和安全的特性。整合索引各类应用系统数据、外
10、部信息库、自建信息库、等多种信息资源;线点科技检索子系统作为内容管理服务模块,实现内容的个性化搜索服务。整个系统架构拥有很强的扩展性,并对用户开放web service接口。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 12 页 - - - - - - - - - 北京线点科技有限公司全文检索产品白皮书标准模版编号 : M03_02_05 www.xd- 线点科技版本 : V1.02 日期 : 2011-9-5 第 7 页 / 共 12 页三 产品功能(1) 提供全方位
11、检索手段, 包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、模糊检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性程度排序等。实现精确计算,报告准确的检索记录数。(2)支持对检索结果的各种排序:基于文章内容与检索表达式的相关度计算的相关性排序;基于一个或多个特征属性的字段排序。(3)支持检索结果的统计和浏览(4)提供动态索引,能够实时提供检索服务。即数据增删改时快速同步更新索引,而不需重建整个索引也无需局部重建索引。(5)支持按词索引、按字索引和字词混合索引。即适应不同应用环境的需求。(6)完善的非结构化数据管理。(7)支持多种数据源数
12、据的全文索引。可自动将关系型数据库中的数据导入全文数据库,如 DB2、 Oracle、 SQLServer、 MySQL 、 sybase 、Informix、Postgresql 、Access 、达梦数据库、人大金仓数据库,并自动保持同步更新。(8)支持多种格式文档信息全文检索,文档格式二百余种,支持ftp 采集。(9)集成先进的中文自然语言处理技术,实现自然语言及智能扩展检索,如同义词、概念检索、拼音检索检索。(10)提供按栏目、网站、网站群的全文检索功能。(11)支持中英文的混合检索,支持日、韩、法、藏、维多语系。(12)允许使用文中的任意字、词、短语、句和片段进行检索(14)支持结构
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年全文检索产品白皮书 2022 全文 检索 产品 白皮书
限制150内