lucene集成IK实现中文分词检索

最后都变了- 提交于 2019-11-30 17:19:57
    接上篇,解决lucene中文分词问题。
    这里采用IK分词器。
     IKAnalyzer2012_u5.zip下载地址:http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q=
    解压缩后,有如下文件:
    1、将IKAnalyzer2012.jar导入工程;
    2、将IKAnalyzer.cfg.xml、stopword.dic文件拷贝到src根目录下(编译后在classes根目录下);
    3、修改CreateIndex.java文件,用IK分词器替换lucene默认分词器。找到
        indexWriter = new IndexWriter(dir, new StandardAnalyzer(
Version.LUCENE_30), true,
IndexWriter.MaxFieldLength.UNLIMITED);
        替换为:
        indexWriter = new IndexWriter(dir,new IKAnalyzer(), true,
IndexWriter.MaxFieldLength.UNLIMITED); 
    4、修改Select.java文件,用IK分词器替换lucene默认分词器。找到
        QueryParser queryParser = new QueryParser(Version.LUCENE_30,   
            "contents",   new IKAnalyzer() );  

    以上四步即完成集成IK分词器操作。
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!