中文分词之结巴分词~~~附使用场景+demo(net)
常用技能(更新ing): http://www.cnblogs.com/dunitian/p/4822808.html#skill 技能总纲(更新ing): http://www.cnblogs.com/dunitian/p/5493793.html 在线演示: http://cppjieba-webdemo.herokuapp.com 完整demo: https://github.com/dunitian/TempCode/tree/master/2016-09-05 逆天修改版: https://github.com/dunitian/TempCode/blob/master/2016-09-05/jieba.NET.0.38.2.zip 先说下注意点, 结巴分词他没有对分词进行一次去重,我们得自己干这件事;字典得自行配置或者设置成输出到bin目录 应用场景举例 (搜索那块大家都知道,说点其他的) —————————————————————————————————————————————————— 言归正传:看一组民间统计数据:(非Net版,指的是官方版) net版的 IKanalyzer 和 盘古分词 好多年没更新了,所以这次选择了 结巴分词( 这个名字也很符合分词的意境~~结巴说话,是不是也是一种分词的方式呢? ) 下面简单演示一下: 1.先引入包: 2.字典设置: 3