Lucence
IKAnalyzer中文分词器
文 | 分词 | 工具包 |
:
导入包和相关配置文件
配置文件IKAnalyzer.cfg.xml
<?xmlversion="1.0"encoding="UTF-8"?> <!DOCTYPEpropertiesSYSTEM"http://java.sun.com/dtd/properties.dtd"> <properties> <comment>扩展配置</comment> <!--用户可以在这里配置自己的扩展字典 <!--用户可以在这里配置自己的扩展停止词字典 </properties> |
修改配置类Configuration
修改配置类Configuration的分词器,使用IKAnalyzer分词器,主要参看红色部分代码
class Configuration { private Configuration(){} publicfinal Version LOCAL_VERSION=Version.LUCENE_30; //使用IKAnalyzer,当参数为true时,表示使用最大词长分词,false表示使用细粒度分词 publicstaticfinal Analyzer ANALYZER=new IKAnalyzer(true); static Directory DIRECTORY; static String PATH="e:/testdir/lucenedir"; static{ try{ DIRECTORY=FSDirectory.open(new File(PATH)); catch (Exception e) { // TODO: handle exception publicstatic Directory getDIRECTORY() { DIRECTORY; } |
文章来源: Lucence-IKAnalyzer中文分词器