HanLP基于Java语言的'装配'
吐槽
网上翻了很多相关Hanlp配置的相关连接,大多都是说要什么,也有github的连接,但是没有具体指出位置。甚至还有hanlp.properties配置写jdbc的。我真的佩服。在翻了一天的网站后(大多重复一致的),终于给我弄出来了(应该是弄出来了吧 = =)。
需要的东西
需要的东西就大部分网上说的东西:
1.Hanlp的jar
2.data文件夹(分为简易,标准,完整,三个版本)
3.hanlp.properties文件
具体操作
HanLP.jar和data
https://global.v2ex.com/t/503247
这个连接里可以直接点击下载Hanlp的jar包和数据部分
还有许多的网站给出的是GitHub的官方连接:
https://github.com/hankcs/HanLP/releases
这里应该下载latest release里的内容,就是第二张图中的几个zip文件(下载第一个和第二个就行)。
其中hanlp-1.7.6-release.zip里面就是相关的jar包。
hanlp-1.7.6.zip解压后有一个data文件可以直接拿来用(不知道怎么回事,我在没加入data文件是,运行词义拆分也是可以执行的,我暂时就是直接用的这个data)。
如果是Maven框架的话可以直接去官网的库中搜相关的JAR
https://mvnrepository.com/
在该网页中直接搜索需要的jar
选择版本后,直接粘贴复制到pom.xml就行。
hanlp.properties文件内容
https://blog.csdn.net/baidu_15113429/article/details/76549319
这里面有相关的文件内容,直接创建一个空文件改下后缀就行。
同时,该连接也有目录的格式。可以照着去调整文件位置。如果用的是Maven框架,直接将文件放在resources的资源包里就可以了。
效果
package com.study.NatureSpilt;
import com.hankcs.hanlp.HanLP;
public class MainClass {
public static void main(String[] args) {
System.out.println(HanLP.segment("hanlp,自然语言处理!"));
}
}
如果出现报错,找不到文件之类的,去data文件夹里找相应的txt,然后到 hanlp.properties里去配置就行,照着样子写就OK。
相关的学习网址
https://www.hankcs.com/nlp/hanlp.html
这个是注码的解释:
https://www.hankcs.com/nlp/part-of-speech-tagging.html#h2-8
来源:CSDN
作者:nulixuexidexiaojie
链接:https://blog.csdn.net/qq_42455916/article/details/103889540