Python人工智能-基于百度接口

Posted yangzhizong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python人工智能-基于百度接口相关的知识,希望对你有一定的参考价值。

参考百度AI官网:http://ai.baidu.com/

准备工作:

  支持Python版本:2.7.+ ,3.+

安装使用Python SDK有如下方式

  >如果已经安装了pip,执行 pip install baidu-aip 即可。

  >如果已安装setuptools,执行 python setup.py install 即可。

登录百度ia网站:

  1、用百度账号登录

  2、进入左侧语言应用

  3、创建新应用

 

实验1:语音合成(将文字转为语音)

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = \'写注册的APP_ID\'
API_KEY = \'写注册的API_KEY\'
SECRET_KEY = \'写注册的SECRET_KEY\'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result  = client.synthesis(\'中南山下活死人墓预知后事如何请听下回分解\', \'zh\', 1, {
    \'vol\': 5,
    \'spd\': 3,
    \'pit\': 9,
    \'per\': 3,
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open(\'auido.mp3\', \'wb\') as f:
        f.write(result)

参数备注:

 

实验2:语音识别(语音转为文字)+语音合成

from aip import AipSpeech
import os


""" 你的 APPID AK SK """
APP_ID = \'同上\'
API_KEY = \'同上\'
SECRET_KEY = \'同上\'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

#语音识别(将音频转为文字)

# 读取文件
def get_file_content(filePath):

    #实现文件自动转换(只要修改下面的本地文件并传值就可以执行)
    any2pcm=f"ffmpeg -y  -i {filePath}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm"
    os.system(any2pcm)

    with open(f"{filePath}.pcm", \'rb\') as fp:
        return fp.read()

# 识别本地文件
res=client.asr(get_file_content(\'ea.m4a\'), \'pcm\', 16000, {
    \'dev_pid\': 1536,
})

#拿到的是视频转换后的文字
print(res[\'result\'][0])

#语音合成(再将文字转为音频)
result  = client.synthesis(res[\'result\'][0], \'zh\', 1, {
    \'vol\': 5,
    \'spd\': 3,
    \'pit\': 9,
    \'per\': 3,
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open(\'auido.mp3\', \'wb\') as f:
        f.write(result)

#调用系统默认播放器
os.system("auido.mp3")

注意点:

  1. 语音识别的格式只支持pcm,万能格式转换命令为:

    ffmpeg -y  -i audio.wav(原文件名)  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm(转换后的文件名字)

  2. os.system()是直接可以执行系统命令

 

以上是关于Python人工智能-基于百度接口的主要内容,如果未能解决你的问题,请参考以下文章

Python调用百度API实现人脸融合

python实现基于百度路径规划接口的坐标对获取两点驾车距离的计算

基于Python的百度AI人脸识别API接口(可用于OpenCV-Python人脸识别)

百度上线NLP智能问答大赛,10万元奖金邀你来战

人工智能 之 语音

python调用百度ocr接口,实现图片内文字识别