IK Analyzer分词器
这个其实比较好配,奈何资源不好找,而且用solr搜中文一般都用这个我把分词器打了个包放在下面了。里面没有字典,希望哪位又好用的互通下有无。
http://pan.baidu.com/s/1pLjE2Tl
假设solr部署在tomcat上,位置webapp\solr
1、IKAnalyzer2012FF_u1.jar 放在solr\WEB-INF\lib
2、IKAnalyzer.cfg.xml和stopword.dic 放在solr\WEB-INF\classes
IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典
<entry key="ext_dict">ext.dic;</entry>
-->
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry>
<!--放一些其他好用的字典-->
</properties>
3、找到solr数据文件夹 我这里是/media/data/solr 在文件夹里面找到你的collection的目录 我的叫test,也就是这个地址/media/data/solr/test这个目录下有个文件是managed-schema(老版本solr是schema)在里面加入ik配置
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
<field name="ik" type="text_ik" indexed="true" stored="true" multiValued="false" />
需要中文分词的字段配置
<field name="title" type="text_ik" indexed="true" stored="true" multiValued="false"/>
配置完了
来源:oschina
链接:https://my.oschina.net/u/2455415/blog/699951