falsk 基础 语音识别与语音合成()

Posted yb635238477

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了falsk 基础 语音识别与语音合成()相关的知识,希望对你有一定的参考价值。

首先搜索http://ai.baidu.com/进入官网。

技术分享图片

下拉找到百度语音:

技术分享图片

然后创建一个语音应用:

管理应用之后:

技术分享图片

语音合成:

然后新建一个py文件:

from aip import AipSpeech

APP_ID = 14454183
API_KEY = txNuGCIsenvEB93I70EsWwB4
SECRET_KEY = dzdok3DcUeUxE28atFgiOQzxVd91BmQu

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
res = client.synthesis(我如果爱你,options={
    "vol":8,
    "pit":8,
    "spd":5,
    "per":4
})
with open("audio.mp3",wb)as f:
    f.write(res)

语音识别:

在本地保存一个音频文件,新建一个py文件:

from aip import AipSpeech
import os

APP_ID = 14454183
API_KEY = txNuGCIsenvEB93I70EsWwB4
SECRET_KEY = dzdok3DcUeUxE28atFgiOQzxVd91BmQu

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
    ‘‘‘
    因为只能识别pcm格式的音频,所以利用ffmpeg将mp3格式转化成pcm格式
    ‘‘‘
    cmd_str = "ffmpeg -y -i {0} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {0}.pcm".format(filePath)
    os.system(cmd_str)
    with open("%s.pcm"%(filePath), rb) as f:
        return f.read()
res = client.asr(speech=get_file_content("audio.mp3"),options={
    "dev_pid":1536,
})
print(res)

要记得将ffpeg中的bin目录放在系统的环境变量里,然后重启pycharn。

然后我们写一个demo:

 

以上是关于falsk 基础 语音识别与语音合成()的主要内容,如果未能解决你的问题,请参考以下文章

重磅!一行代码轻松搞定中英文语音识别与语音合成|代码开源!

重磅!一行代码轻松搞定中英文语音识别与语音合成|代码开源!

golang 使用科大讯飞进行语音合成与识别

语音识别语音合成使用基础(讯飞开放平台)

首次开源 一行代码中英文语音识别合成翻译核心功能

基于51单片机+LD3320语音模块+SYN6288语音合成——语音识别智能分类垃圾桶