语音识别学习资料入门整理

Posted 2020-10-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了语音识别学习资料入门整理相关的知识，希望对你有一定的参考价值。

GMM-HMM语音识别模型原理篇

隐马尔科夫模型-HMM-A Tutorial On Hidden Markov Models

0.概念：

语音信号处理/模式识别/统计分析，

1.算法:

常用的深度学习算法，包括
cnn/dnn/rnn/lstm;
GMM/SVM/CRF/MaxEnt/HMM;
对CTC 有经验;

2.框架:

熟悉至少一种深度学习框架，包括 kaldi, tensorflow, caffe, mxnet 等；
常用工具如 Caffe, CNTK, TensorFlow, Pytorch, Kaldi, CTC 技术
熟握 Kaldi, SRiLM, RNNLM, TensorFlow 等社区开源工具中的一种及以上

3.语言：

精通C/C++，Python，Shell编程语言，对数据结构和算法设计有深刻理解；
熟悉C/C++或Python等任意一种编程语言

4.paper:

在学术会议期刊发表过相关论文者优先，有算法优化经验者优先
在相关国际会议或主流期刊上发表论文者优先（ICASSP，Interspeech，ASRU）
在Interspeech，ICASSP等语音学术会议中有论文发表者优先。

4.领域：

计算机、信号处理、自动化

http://www.inf.ed.ac.uk/teaching/courses/asr/

视频：數位語音處理概論

http://ocw.aca.ntu.edu.tw/ntu-ocw/ocw/cou/104S204/1

https://book.douban.com/review/8658211/#comments

以上是关于语音识别学习资料入门整理的主要内容，如果未能解决你的问题，请参考以下文章

张海腾：语音识别实践教程

tensorflow入门——3解决问题——4让我们开始吧

深度学习100例 | 第41天-卷积神经网络（CNN）：UrbanSound8K音频分类（语音识别）

电脑中识别语音文件的操作方法

PaddlePaddle入门-3

神经网络入门介绍（非常易懂）