统计语言模型工具-kenlm的安装
在最近的工作到需要一个语言模型,为句子打分,本来准备用srilm来做,后来调研发现kenlm无论在内存还是速度上都比srilm好很多。srilm很好安装,安装过程中基本没遇到什么问题,kenlm的安装就是一个大坑,至今自己都觉得是玄学安装,这边记录下安装过程。 源码地址: https://github.com/kpu/kenlm 在安装kenlm之前需要先安装很多依赖包,主要有: 具体的安装可以参考: https://blog.csdn.net/lijiaqi0612/article/details/90082919 在安装bzip2的时候可能会因为解压tar包报错,所以bzip2包可以不通过源码安装,直接用: sudo apt-get install libbz2-dev 安装完上面依赖之后开始安装kenlm. mkdir -p build cd build cmake .. make -j 4 github上是采用上面这几个命令即可安装完成,但是实际在操作的时候可能cmake的时候就报错了,这时候检查一下自己的所有安装的依赖是否都已经完成。 我的情况是cmake没有问题,但是最后make的时候总是不成功,搞了6个小时,玄学的解决。 报错: CMakeFiles/sorted_uniform_test.dir/sorted_uniform_test.cc.o:在函数‘boost: