全文检索: 全文检索就是先分词创建索引,再执行搜索的过程。
全文检索的流程分为两大部分:索引流程、搜索流程。
索引流程:采集数据--->构建文档对象--->创建索引(将文档写入索引库)。
搜索流程:创建查询--->执行搜索--->渲染搜索结果。
分词是全文检索的核心。
所谓的分词,就是将一段文本,根据一定的规则,拆分成一个一个词。
Lucene是根据分析器实现分词的。针对不同的语言提供了不同的分析器。并且提供了一个通用的标准分析器StandardAnalyzer
1.把查询的数据转换成Document文档用Lucene创建索引库
2.把查询的关键词用Lucene分词在索引库内检索
3.返回检索后的数据