Lucene简介和使用
全文检索 数据分类: 结构化数据:格式、长度、类型等固定,如数据库中的数据 非结构化数据:格式、长度、类型等不固定,如pdf、html文件 数据查询: 结构化数据:sql语句 非结构化数据:将非结构化数据转换为结构化数据,建立索引然后查询 全文检索就是先创建索引然后查询索引的过程 全文检索的应用场景 : 搜索引擎,如百度、谷歌 站内搜索,如微博、csdn文章 电商搜索,如淘宝、京东 等等 Lucene简介 Lucene是一个基于Java开发的开源全文检索引擎工具包,但它 不是一个完整的全文检索引擎,而是一个全文检索引擎的架构 ,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。 Lucene实现全文检索流程 上面说到 全文检索就是先创建索引然后查询索引的过程 ,Lucene实现全文检索就是需要创建索引和查询索引。 使用Lucene 创建索引 需要的jar包: commons-io-2.6.jar junit-4.10.jar lucene-analyzers-common-7.4.0.jar lucene-core-7.4.0.jar 测试用的原始文档D:\java