分词器

lucene集成IK实现中文分词检索

最后都变了- 提交于 2019-11-30 17:19:57
接上篇,解决lucene中文分词问题。 这里采用IK分词器。 IKAnalyzer2012_u5.zip下载地址:http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q= 解压缩后,有如下文件: 1、将IKAnalyzer2012.jar导入工程; 2、将IKAnalyzer.cfg.xml、stopword.dic文件拷贝到src根目录下(编译后在classes根目录下); 3、修改CreateIndex.java文件,用IK分词器替换lucene默认分词器。找到 indexWriter = new IndexWriter(dir, new StandardAnalyzer( Version.LUCENE_30), true, IndexWriter.MaxFieldLength.UNLIMITED); 替换为: indexWriter = new IndexWriter(dir,new IKAnalyzer(), true, IndexWriter.MaxFieldLength.UNLIMITED); 4、修改Select.java文件,用IK分词器替换lucene默认分词器。找到 QueryParser queryParser = new