Lucence-IKAnalyzer中文分词器

匿名 (未验证) 提交于 2019-12-03 00:26:01

Lucence

IKAnalyzer中文分词器

文 | 分词 | 工具包 |

:

导入包和相关配置文件

配置文件IKAnalyzer.cfg.xml

<?xmlversion="1.0"encoding="UTF-8"?>

<!DOCTYPEpropertiesSYSTEM"http://java.sun.com/dtd/properties.dtd">

<properties>

<comment>扩展配置</comment>

<!--用户可以在这里配置自己的扩展字典

<!--用户可以在这里配置自己的扩展停止词字典

</properties>

修改配置类Configuration

修改配置类Configuration的分词器,使用IKAnalyzer分词器,主要参看红色部分代码

class Configuration {

private Configuration(){}

publicfinal Version LOCAL_VERSION=Version.LUCENE_30;

//使用IKAnalyzer,当参数为true时,表示使用最大词长分词,false表示使用细粒度分词

publicstaticfinal Analyzer ANALYZER=new IKAnalyzer(true);

static Directory DIRECTORY;

static String PATH="e:/testdir/lucenedir";

static{

try{

DIRECTORY=FSDirectory.open(new File(PATH));

catch (Exception e) {

// TODO: handle exception

publicstatic Directory getDIRECTORY() {

DIRECTORY;

}

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!