看日本电影再也不怕看不懂了，6行Python代码轻松实现音频转文字

Posted 2021-09-03 梦子mengy7762

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了看日本电影再也不怕看不懂了，6行Python代码轻松实现音频转文字相关的知识，希望对你有一定的参考价值。

前面几天想看一个电影（至于什么电影就不说了），搜了半天没有中文字幕。

这种事情，你是不是也预定过！很痛苦，有声音和图形。但是你听不懂！嗯？

于是，我想想现在的科技这么发达，难道找不到音频转文字的软件吗！

于是我就搜了一下：

这么贵！

好在这难道不了一个吃苦耐劳的程序员，在知乎某位大佬哪里找到了这个东西！

IBM 爸爸的Speech to text

好了，大佬们，准备好你们的音频，以及Python，我们开始吧！！

第一步：

点击首页紫色的那个「Star for free in IBM Cloud」按钮，

注册IBM Cloud并登陆（注册不了的亲，记得科学上网）。

第二步：

添加服务，添加后是这样的：

点击现有服务，找到已有的服务。

点击服务名称查看详情。

看到页面下方显示服务凭证，且username和password都是加密符号表示。

点击右侧的「显示」，打开眼睛，

把username和password记下来

（复制到记事本里啦不要翻小本本了！）

好了，任务完成，我们可以把官网关掉了。

第三步：

安装SpeechRecognition包

打开cmd，输入pip install SpeechRecognition，耐心等待一会就安装成功了。

出现这个就安装成功了!

第四步:

打开Jupyter Notebook开始撸代码！

运行这一步发现报错了

原来要wav格式。

给大家推荐一个好用的神器：格式工厂。

音频视频文件转格式我都用它，方便小巧。

转格式后把引号里的内容改成1.wav就可以运行了。接着定义账号密码，

把引号里的XXX改成你自己的

IBM_USERNAME = ‘XXXXXXXX’

IBM_PASSWORD= ‘XXXXXXXX’

以及调用IBM的Speech to text。

我这2分多钟的音频大概运行了半分钟左右吧。

这个text，就是你音频转过来的文字了。

让我们来试试：

print(text)

虽然准确率没有100%，但是也很厉害了！

它还支持很多语言。只要把language变量改成以下这些语言就可以了

ar-AR 阿根廷语
en-UK 英式英语
en-US 美式英语
es-ES 西班牙语
fr-FR 法语
ja-JP 日语
pt-BR 巴西葡萄牙语
zh-CN 中文

温馨提示：每个免费账户每个月都可使用100分钟，30天不活跃服务将会被删除

话不多说，我去看电影去了。

希望对你有帮助！

以上是关于看日本电影再也不怕看不懂了，6行Python代码轻松实现音频转文字的主要内容，如果未能解决你的问题，请参考以下文章

Java小项目之：文件的加密与解密！再也不怕存的小电影被别人发现了！

Netty架构原理，不怕你看不懂！

注释

有了这款 GitHub 开源神器，以后再也不怕找不到电影资源啦！

008注释

不会SQL注入，连漫画都看不懂了