实时语音转文本PC端实时语音转文本(麦克风外音&系统内部音源)

Posted 优小U

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了实时语音转文本PC端实时语音转文本(麦克风外音&系统内部音源)相关的知识,希望对你有一定的参考价值。


语音转文字这个功能可以应用在视频动态字幕,语音快速输入,实时记录通话内容,高级应用可以在人工智能,语音识别,智能助手方面,还需要一点机器学习可以做出一些好玩的东西,比如PC端AI助理,类似移动端的 “小度”,“小艺”,“小爱”。

一、安装讯飞输入法

二、输入法设置

安装好后,切换到讯飞输入法,点击右下角设置图标。

点击左侧语音选项,设置结束等待时间0.7秒,设置结果上屏方式:说话过程中上屏(一边说话一边打字);说话结束时上屏(说话完成后打字),勾选语音长文本模式会触发一直监听说话并打字。

选择录音设备,使用麦克风进行打字,设置如下:(外音输入)

三、麦克风打字测试

点击输入法麦克风图标会自动开启录音模式,打开一个新的记事本,鼠标聚焦在可以输入的位置,然后可以一边说话一边打字。

四、系统内部音源转文字

如果希望将正在看的视频或者音频的台词转成文字可以选择录音设备,将麦克风停用,选择立体声混音,这样就可以将系统内部的声音作为声音来源并实时转成文字。


下面以一个小视频为例:

实时语音识别-系统内部音源

五、跨屏输入

先下载一个手机版输入法,然后登录账号,打开PC设置切换到账号设置,使用手机APP扫码登录,然后在输入法右下角设置选择【跨屏输入】,然后用APP扫码连接:

手机连接后,可以在手机端进行录音,然后在PC端查看语音输入的内容。

PS: 跨屏输入会经常断开连接,这个体验有点不好。

六、总结

对于外部麦克风一般要发音相对标准,没有噪音的环境下识别度会高一些;对于系统内部音频需要语速不能太快(一般背景音不会有太大影响),我们可以使用这种方法做临时的字幕生成器,配合翻译api,还可以实时翻译外文视频;辅助语音转写工作,解放双手;另外,输入法对英文的识别效果也不错,只需调整识别的语言种类即可。

以上是关于实时语音转文本PC端实时语音转文本(麦克风外音&系统内部音源)的主要内容,如果未能解决你的问题,请参考以下文章

语音/语音到文本[关闭]

使用 Python 和 PyAudio 的语音转文本无法在操作系统上运行

Azure Cognitive Services- Speech To Text

是否可以将实时数据发送到 Bing 语音识别?

iOS-文本转语音

以编程方式在android中的软输入键盘上禁用语音到文本按钮(麦克风)