Kaldi语音识别工具编译问题记录(踩坑记录)

Posted 小小马车夫

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kaldi语音识别工具编译问题记录(踩坑记录)相关的知识,希望对你有一定的参考价值。

✨ 博客主页:小小马车夫的主页

文章目录


前言

最近由于项目需要要研究下ASR语言识别,用到了Kaldi语音识别工具,Kaldi是一个语音识别的工具箱,由C++语言开发,外围用shell脚本或其他脚本调用。这里主要记录下一在编译Kaldi时遇到各种问题(坑)。

1、cuda

首先是又官网下载cuda:
https://developer.nvidia.com/cuda-downloads

安装cuda遇到了依赖的问题(说来也奇怪同事安装的时候什么错也没遇到,吐嘈):
*** Requires: libwayland-client.so.0()(64bit) ***
*** Requires: libnvidia-egl-wayland.so.1()(64bit) ***

说明是缺库libwayland-client.solibnvidia-egl-wayland.so,那就下载对应的库,安装之后又报错:


没办法,继续下载吧,最后依赖库下载地址如下:

ibwayland-client-1.15.0-1.el7.x86_64.rpm
egl-wayland-1.1.6-1.el7.x86_64.rpm
libglvnd-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
libwayland-server-1.15.0-1.el7.x86_64.rpm
libglvnd-egl-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
https://download-ib01.fedoraproject.org/pub/epel/7/x86_64/Packages/e/egl-wayland-1.1.6-1.el7.x86_64.rpm
http://mirror.centos.org/centos/7/os/x86_64/Packages/libwayland-client-1.15.0-1.el7.x86_64.rpm
https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/libglvnd-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
http://mirror.centos.org/centos/7/os/x86_64/Packages/libwayland-server-1.15.0-1.el7.x86_64.rpm
https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/libglvnd-egl-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
挨个下载下来安装吧:
rpm -ivh bwayland-client-1.15.0-1.el7.x86_64.rpm
rpm -ivh libglvnd-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
lrpm -ivh libwayland-server-1.15.0-1.el7.x86_64.rpm
rpm -ivh libglvnd-egl-1.0.1-0.6.git5baa1e5.el7.x86_64.rpm
rpm -ivh egl-wayland-1.1.6-1.el7.x86_64.rpm

2、openfst

openfst编译首先会遇到下面的错误:

1) ERROR: cannot verify www.openfst.org’s certificate, issued by ‘/C=US/O=Let’s Encrypt/CN=R3’: Issued certificate has expired.To connect to www.openfst.org insecurely, use `–no-check-certificate’

ERROR: cannot verify www.openfst.org's certificate, issued by ‘/C=US/O=Let's Encrypt/CN=R3’:
  Issued certificate has expired.
To connect to www.openfst.org insecurely, use `--no-check-certificate'.
ERROR: cannot verify www.openslr.org's certificate, issued by ‘/C=US/O=Let's Encrypt/CN=R3’:
  Issued certificate has expired.
To connect to www.openslr.org insecurely, use `--no-check-certificate'.
make: *** [openfst-1.7.2.tar.gz] Error 5

按错误提示添加--no-check-certificate, 修改tools/Makefile

2) error: redeclaration ‘Weight fst::Power(const Weight& size_t)’…
然后编译时遇到下面错误:


通过错误信息看是, 有函数重复定义了,不可思议,也只能接受。最后还是找到了解决办法:
https://www.openfst.org/twiki/bin/view/Forum/FstForum
很明显了,修改tools/openfst-1.7.2/src/include/fst/weight.h如下:

重新编译: make openfst 一切正常了。

3、SIRLM

1) Usage: extras/install_srilm.sh < name > < organization > < email >
编译SIRLM首先会遇到下述错误:


看错误提示,是需要参数,先自己造一下:

extras/install_srilm.sh zhangsan china.com test@163.com

2) srilm.tgz下载不下来
srilm.tgz这个原因主要是连接根本打不开,没办法,自己另找其办法下载吧:
https://github.com/gsayer/SRILM
下载下来后解压,得到srilm-1.7.3.tar.gz, 把它改名为srilm.tgz, 放到tools下面,继续编译:

cd tools
extras/install_srilm.sh

一切安好~

4、Kaldi需要升级gcc到5.0及以上

gcc(configure failed: c++ (g++ 4.8.5) is not supported You need GNU g++ >= 5.0, Apple clang >= 6.0 or LLVM clang >= 3.5. ***)
上面所有的依赖安装完了,并把错误都解决了,就可以编译Kaldi了。
然而,你可能会遇到又一个错误:

完犊子,gcc需要升级,在此说明一下,博主刚开始是下载gcc的tar包安装的,为此还升级了make和glibc,最后glibc升级没有报错但有问题,导致系统所有的命令都不能用了,最后还重装了系统。因此,强烈不建议对手动升级gcc不熟悉的朋友这么做!!
好在,最后还是找到了解决办法:

yum install -y centos-release-scl
yum install -y devtoolset-7-gcc devtoolset-7-gcc-c++
scl enable devtoolset-7 bash

感谢这篇博客的博主:https://blog.csdn.net/qq_50607888/article/details/123908033

总结

以上就是博主在编译Kaldi时踩的坑,记录下来,如果你也遇到同样的错误,希望对你有帮助~

如果觉得有些帮助或觉得文章还不错,请关注一下博主,你的关注是我持续写作的动力。另外,如果有什么问题,可以在评论区留言,或者私信博主,博主看到后会第一时间回复。
【间歇性的努力和蒙混过日子,都是对之前努力的清零】
欢迎转载,转载请注明出处:https://blog.csdn.net/xxm524/article/details/126239910

以上是关于Kaldi语音识别工具编译问题记录(踩坑记录)的主要内容,如果未能解决你的问题,请参考以下文章

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

Kaldi 语音识别基础教程

在ubuntu下安装kaldi基本步骤

基于kaldi的iOS实时语音识别(本地)+03+音频采集传输