看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
Posted 梦子mengy7762
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字相关的知识,希望对你有一定的参考价值。
前面几天想看一个电影(至于什么电影就不说了),搜了半天没有中文字幕。
这种事情,你是不是也预定过!很痛苦,有声音和图形。但是你听不懂!嗯?
于是,我想想现在的科技这么发达,难道找不到音频转文字的软件吗!
于是我就搜了一下:
这么贵!
好在这难道不了一个吃苦耐劳的程序员,在知乎某位大佬哪里找到了这个东西 !
IBM 爸爸的Speech to text
好了 ,大佬们,准备好你们的音频,以及Python,我们开始吧!!
第一步:
点击首页紫色的那个「Star for free in IBM Cloud」按钮,
注册IBM Cloud并登陆(注册不了的亲,记得科学上网)。
第二步:
添加服务,添加后是这样的:
点击现有服务,找到已有的服务。
点击服务名称查看详情。
看到页面下方显示服务凭证,且username和password都是加密符号表示。
点击右侧的「显示」,打开眼睛,
把username和password记下来
(复制到记事本里啦不要翻小本本了!)
好了,任务完成,我们可以把官网关掉了。
第三步:
安装SpeechRecognition包
打开cmd,输入pip install SpeechRecognition,耐心等待一会就安装成功了。
出现这个就安装成功了!
第四步:
打开Jupyter Notebook开始撸代码!
运行这一步发现报错了
原来要wav格式。
给大家推荐一个好用的神器:格式工厂。
音频视频文件转格式我都用它,方便小巧。
转格式后把引号里的内容改成1.wav就可以运行了。接着定义账号密码,
把引号里的XXX改成你自己的
IBM_USERNAME = ‘XXXXXXXX’
IBM_PASSWORD= ‘XXXXXXXX’
以及调用IBM的Speech to text。
我这2分多钟的音频大概运行了半分钟左右吧。
这个text,就是你音频转过来的文字了。
让我们来试试:
print(text)
虽然准确率没有100%,但是也很厉害了!
它还支持很多语言。只要把language变量改成以下这些语言就可以了
- ar-AR 阿根廷语
- en-UK 英式英语
- en-US 美式英语
- es-ES 西班牙语
- fr-FR 法语
- ja-JP 日语
- pt-BR 巴西葡萄牙语
- zh-CN 中文
温馨提示:每个免费账户每个月都可使用100分钟,30天不活跃服务将会被删除
话不多说,我去看电影去了。
希望对你有帮助!
以上是关于看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字的主要内容,如果未能解决你的问题,请参考以下文章
Java小项目之:文件的加密与解密!再也不怕存的小电影被别人发现了!