自然语言--kenlm环境搭建

Posted Terry_dong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自然语言--kenlm环境搭建相关的知识,希望对你有一定的参考价值。

这篇博客主要是分享kenlm环境搭建的过程,同时也当给自己留个存档。

      对于这个环境的搭建,我是在ubuntu16.04的虚拟机中进行的,下面直接进入正题:

1、首先看一下此课程中搭建需要用的东西,如下图所示。在运行环境处,对于anaconda和NLTK是很简单的,这里就不多做解释了,如果有需要的可以留言交流。

2、直接进入KenLM环境的搭建,首先进入kenlm的github网址点击打开链接,然后会进入到kenlm的界面,如下:

3、使用命令:wget -O - http://kheafield.com/code/kenlm.tar.gz |tar xz 对kenlm库进行下载,如下所示:

(4)在刚刚kenlm的github官网中可以看到编译的方法:

 

mkdir -p build
cd build
cmake ..
make -j 4

执行方法如下图:

 

对于提示的没有安装cmake,那么进行cmake的安装:

继续执行我们的编译,会看到如下的错误:

对于上图中的错误,谷歌了一下,得到了一个方法,使用命令apt install libboost-dev libboost-test-dev安装boost,如下:

再次尝试编译,如下所示,可以看出是有效果的,然而好像boost的包还是不全面,这就说明我们刚刚没有下载全:

又在网上找了个安装全部库的命令:sudo apt-get install libboost-all-dev(由于此前没截图,此处省略),直接展示执行完后的效果如下:

注意:https://bitbucket.org/eigen/eigen/get/3.2.8.tar.bz2  这个网址不生效,失效了。全都已经搬到GitHub里了。

 所以可以用下面的 地址: wget -O -  https://gitlab.com/libeigen/eigen/-/archive/3.2.10/eigen-3.2.10.tar.bz2 | tar xj 

 eigen说明路径:http://eigen.tuxfamily.org/index.php?title=Main_Page

如图所示,boost的问题解决了,然后按照提示解决Eigen3的问题,最后我们继续cmake:

至此,cmake问题解决。

(5)执行命令:make -j 4,如下所示:

 

至此,kenlm环境搭建完毕。

(6)执行训练模型的脚本,如下所示,可以看出,好像我们的环境还没有搭建完全,提示的是lmplz不存在,然后build_binary不存在:

(7)谷歌查找了一些资料后,发现自己的bin文件夹中是有这些文件的,那么唯一的问题就是我们的系统中没有为它们设置环境变量,将kenlm的路径添加进去即可,这个路径依据自己的机器上的具体路径为准,我的如下图中箭头所示:

保存上述文件,然后执行source .profile,使环境变量生效。

(8)重新执行下训练脚本,如下所示,成功了:

 

       至此,kenlm环境已经搭建成功了,此次分享就到这里,有什么不对的地方欢迎大家交流指正。

关键词:CMake Warning at /usr/share/cmake-3.5/Modules/FindBoost.cmake:725 (message):
  Imported targets not available for Boost version
train.sh.UNK: line 1: lmplz: command not found
train.sh.UNK: line 2: build_binar

以上是关于自然语言--kenlm环境搭建的主要内容,如果未能解决你的问题,请参考以下文章

win10下安装Cygwin配置gcc编译环境

ubuntu kenlm安装和使用

kenlm的使用

vs2013+ffmpeg开发环境搭建

mybatis 环境搭建和基本说明

Zabbix服务器监控环境搭建