Lucene

Lucene实现全文检索技术(包含SpringBoot整合Lucene 7.6.0)

Lucene实现全文检索技术(包含SpringBoot整合Lucene 7.6.0)

Lucene实现全文检索的流程 ① 绿色表示索引过程,对要搜索的原始内容进行索引构建一个索引库,索引过程包括:确定原始内容即要搜索的内容、采集文档、创建文档、分析文档、索引文档 ② 红色表示搜索过程,从索引库中搜索内容,搜索过程包括:用户通过搜索界面、创建查询、执行搜索,从索引库搜索引擎渲染搜索结

Joe.Ye Joe.Ye 2023-05-04
0 0 1
SpringBoot+Lucene第六篇 — 索引的增删改查

SpringBoot+Lucene第六篇 — 索引的增删改查

为了减少代码量,写一个公用的增删改公用的获取IndexWriter对象的方法 /** * 增删改公用的获取IndexWriter对象 * @return * @throws Exception */ public IndexWriter getIndexWriter() throws Exc

Joe.Ye Joe.Ye 2023-05-04
0 0 0
SpringBoot+Lucene第五篇 — 创建索引 — 域的再学习

SpringBoot+Lucene第五篇 — 创建索引 — 域的再学习

前文实现了一个lucenne的全文检索,回顾一下我们的流程: 针对每个文档,构建一个文档对象。该文档对象里面用了不同的域,描述了该文档的信息,大小,内容。。。 将文档对象扔进索引库 将索引库,存放在本地磁盘 到磁盘的索引库目录下,创建了一个查询对象,查询条件是:指定内容分词进行查询,获取查询结果

Joe.Ye Joe.Ye 2023-05-03
0 0 0
SpringBoot+Lucene第四篇 — 入门代码

SpringBoot+Lucene第四篇 — 入门代码

需求:通过关键字搜索文件,凡是文件名或文件内容包括关键字的文件都需要找出来:下图(是一堆文件列表) pom.xml <dependency> <groupId>org.apache.lucene</groupId> <artifactId&g

Joe.Ye Joe.Ye 2023-05-03
0 0 0
Lucene的学习第三篇 — 分词

Lucene的学习第三篇 — 分词

Lucene创建索引—分词,分词主要介绍这几个问题  分词是什么?  分词干嘛?  分词怎么分? 例如:我们能找到aaabbb.txt文档,但是不能找到aaabbb文档,好像说明fileName只能进行精确匹配。但是不能找到XXXX.txt文档,说明不是精确匹配,而是在索引库中全文检索.txt

Joe.Ye Joe.Ye 2023-05-03
0 0 1
Lucene的学习第二篇 — Lucene的流程与构建文档对象

Lucene的学习第二篇 — Lucene的流程与构建文档对象

既然Lucene是实现全文检索,那么明白以下几个问题, Lucene是什么? Lucene实现全文检索的流程? 索引到底是如何创建的?(Indexing) 索引里面存放的又是什么东西? 搜索的的时候又是如何去查找索引的?(Search) 这5个问题搞明白了,那么lucene就算入门了。 1:lu

Joe.Ye Joe.Ye 2023-05-03
0 0 1
Lucene的学习第一篇 — 引出Lucene

Lucene的学习第一篇 — 引出Lucene

需求场景提出 1:在指定(10个)不同名字,不同内容的word文档中,进行任意指定搜索。比如:搜索哪个文档中有:“高富帅”、“吃鸡”、”read”…等词汇 2:站内搜索:搜索任意关键词,出来相关内容。论坛,贴吧,淘宝 3:百度类似的搜索 4:智联招聘的搜索 分析 常规的搜索,我们是对数据库的内容

Joe.Ye Joe.Ye 2023-05-03
0 0 1