2022年Lucene分析与应用 .pdf
《2022年Lucene分析与应用 .pdf》由会员分享,可在线阅读,更多相关《2022年Lucene分析与应用 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、作者简介吴众欣,西安交通大学在读博士,主攻搜索引擎与服务组合。喜欢研读,头脑虽慢,滴水石穿。好奇心重,兴趣广泛。编辑推荐本书通过对 Lucene源代码的解说、辅以图表,并用一些具体实例把所有源代码进行组织与剖析,完整地展示 Lucene从建立索引到查询的过程。本书还通过介绍Lucene的应用,体验 Lucene具体项目开发的应用环境。最后简单地介绍了Nutcl 、和Hadoop 。 本书尤其针对查询过程的算法分析道出了Lucene性能秘密,作者把 Lucene开发者对查询性能的思考历程通过示例展示出来,将Lucene最精华的,最富有神秘色彩的代码剖析明白,这也是本书与其他Lucene书籍不同之
2、处! 本书适用于搜索引擎技术研究人员、Lucene爱好者、对搜索引擎内核与运行机制感兴趣的读者阅读名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 。本书特色:详细解析源代码;完整展示工作过程;介绍具体项目开发的应用环境。本书简介本书对Lucene搜索引擎的源代码进行分析讲解,并用一些具体实例把所有源代码进行组织与剖析,完整地展示 Lucene从建立索引到查询的过程。本书通过介绍Lucene的应用,分析 Lucene具体项目开发的
3、应用环境。最后简单地介绍了Nutch和Hadoop 。 本书适用于开发搜索引擎的技术人员、Lucene爱好者等读者。目录前言第1章 搜索引擎与 Lucene 1.1 搜索引擎与 Lucene简介 1.1.1 搜索引擎分类 1.1.2 Lucene项目简介 1.1.3 其他搜索引擎开发包介绍 1.2 Lucene 的系统架构 1.2.1 Lucene最简示例 1.2.2 Lueene采用的索引结构 1.2.3 Lucene软件包架构 1.3 本书的章节导航第2章 文档逻辑视图与文本分析 2.1 文档逻辑视图 2.2 Lucene的文本分析过程简介 2.3 空格解析器( WhitespaceAna
4、lyzer ) 2.3.1 空格分词器( Whitespace Tokenizer) 2.3.2 Token(标志) 2.4 标准解析器( StandardAnalyzer ) 2.4.1 标准分词器( StandardTokenizer ) 2.4.2 标准过滤器 2.5 打造自己的解析器 2.5.1 常用的中文分词法 2.5.2 对CJKAnalyzer的分析 2.5.3 构造自己的解析器第3章 Lucene 创建索引之一(段索引方式与倒排索引结构) 3.1 倒排结构与段索引方式 3.2 索引写入过程概述第4章 Lucene 创建索引之二(在内存中创建索引) 4.1 创建Document
5、层面索引 4.2 写入field信息 4.3 文件倒排过程 4.4 填写postin ,able 4.5 postingTable的排序过程 4.6 写入field名字文件( .fnm文件) 4.7 写入field信息文件( .fdt ,.fdx 文件) 4.8 写入频率与位置文件( .frq 与.prx 文件)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 4 页 - - - - - - - - - 4.9 TermVector方式写入索引( .tvf ,.tvd 与.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年Lucene分析与应用 2022 Lucene 分析 应用
限制150内