TWEN-ASR 语音识别系列教程--- 运行第一个程序

Posted 初五霸

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TWEN-ASR 语音识别系列教程--- 运行第一个程序相关的知识,希望对你有一定的参考价值。

TWEN-ASR ONE 语音识别系列教程(1)— 运行第一个程序
提示:作者使用 TWEN-ASR ONE V1.0开发板进行开发学习。



前言

    语音识别这个词,相信大家都不陌生,现在流行的智能音箱基本都有语音识别功能,如Alex、小爱音箱、天猫精灵、小度音箱等等。市面上语音识别的模块也很多,主要分为两大类在线语音识别和离线语音识别。前面提到的智能音箱,需要在线才有灵魂。智能音箱可以控制家电,而控制的家电的产品都需要进入相应的生态圈。对于开发者而言,也许会跟我遇到这样的问题:
    (1)唤醒词不能更改;
    (2)离线控制功能受限;
    (3)只能按照智能音箱厂商协议进行产品。
    然而有这么一个芯片,可以任意修改唤醒词,可以离线语音识别控制,可以快速编写程序,这个芯片就是TWEN-ASR。本篇文章将使用TWEN ASR ONE V1.0开发板,进行语音识别和控制测试。主要内容有:

  • TWEN-ASR开发板介绍;
  • 程序编写、下载、调试;
  • TWEN-ASR运行测试。

一、TWEN-ASR开发板介绍

    开发板板载一颗 RGB 灯,引出 26 个 IO,外接喇叭和麦克风,用于快速验证语音产品功能。芯片内置脑神经网络处理器 BNPU,支持 200 条命令词以内的本地语音识别,内置 CPU核和高性能低功耗 Audio Codec 模块,集成多路 UART、IIC、SPI、PWM、GPIO 等外围控制接口,可以开发各类高性价比单芯片智能语音产品方案[1]
在这里插入图片描述

图1.1 TWEN-ASR ONE 引脚分布及功能图

    TWEN-ASR ONE 资源丰富。个人觉得可惜的是没有复位按键。除了主板还有麦克风、扬声器。如下图1.2,1.3所示。
在这里插入图片描述

图1.2 麦克风

在这里插入图片描述

图1.3 扬声器

还有下载程序需要用到的下载器。如下图1.4所示。
在这里插入图片描述

图1.3 扬声器

二、程序编写、下载、调试

    (1)安装天问Block软件。 天问Block开发软件主推图像化编程,当然也可以进行字符编程。其中,天问Block下载网址。安装完成后,编程选择设备为TWEN-ASR,如下图所示。
在这里插入图片描述

图2.1 天问Block设备选择图

    (2)程序编写。 首先打开范例代码1.第一个云因识别程序.hd,默认是图形化编程。
在这里插入图片描述

图2.2 选择范例代码
  • 图形代码
    在这里插入图片描述
图2.3 图形化代码

从代码我们可以看出,程序分两块,一块是初始化,另一块是ASR_CODE。初始化程序是上电时运行一次,而ASR_CODE是循环运行。

初始化过程:
     1、 播报音设置。 可以设置不同的男声、女生。选择还是很多的。设置时,还可以听到声音,有点像手机换铃声,点击铃声就会播放铃声的声音。音量语速根据自己的喜好选择即可。

在这里插入图片描述

图2.4 播报语音选择

     2、 添加欢迎词设置。 欢迎词是上电的时候会播报。
     3、 添加退出语音设置。 一段时间没有语音操作后,模块会播报退出语音,然后需要唤醒词唤醒。
     4、 添加识别词(唤醒词)。 唤醒词是唤醒模块工作的识别词。
     5、 添加识别词(命令词)。 命令词是需要唤醒后工作的识别词。

  • 字符代码
    与前面的图形化编程代码对应如下:
#include "asr.h"
#include "setup.h"

uint32_t snid;
void ASR_CODE();

//{ID:250,keyword:"命令词",ASR:"最大音量",ASRTO:"音量调整到最大"}
//{ID:251,keyword:"命令词",ASR:"中等音量",ASRTO:"音量调整到中等"}
//{ID:252,keyword:"命令词",ASR:"最小音量",ASRTO:"音量调整到最小"}
/*描述该功能...
*/
void ASR_CODE(){
  if((snid) == 4){
    digitalWrite(13,1);
  }
  if((snid) == 6){
    digitalWrite(13,0);
  }
}

void setup()
{
  //{speak:小蝶-清新女声,vol:10,speed:10}
  //{playid:10001,voice:欢迎使用智能管家,用智能管家唤醒我。}
  //{playid:10002,voice:我退下了,用智能管家唤醒我}
  //{ID:2,keyword:"唤醒词",ASR:"智能管家",ASRTO:"我在"}
  //{ID:4,keyword:"命令词",ASR:"打开红灯",ASRTO:"好的,马上打开红灯"}
  //{ID:6,keyword:"命令词",ASR:"关闭红灯",ASRTO:"好的,马上关闭红灯"}
}

程序实现的功能是语音识别到打开红灯会打开红灯,识别到关闭红灯会关闭红灯。 RGB电路如下:
在这里插入图片描述

图2.5 RGB灯原理图

在程序中,PWM4(Pin13)高低电平就是控制红灯的亮灭。

    (3)程序下载。 首先确保线路连接正常,如下图2.6所示。然后需要生成模型,最后编译下载

在这里插入图片描述

图2.6 现在线路连接

在这里插入图片描述

图2.7 下载顺序和选择
生成模型需要登录,如果没有账号密码,需要注册。生成模型后,点击编译下载。第一次下载的时间比较长。可能需要3分钟左右,耐心等待。以下是烧录的过程:

在这里插入图片描述

图2.8 模型生成

在这里插入图片描述

图2.9 下载过程1

在这里插入图片描述

图2.10 下载过程2

下载完成后,就会播放欢迎词。


三、运行测试

程序下载完成后,就会播报欢迎词。

ASR:欢迎使用智能管家,用智能管家唤醒我。

我:智能管家

ASR:我在

我:打开红灯

ASR:好的,马上打开红灯

在这里插入图片描述

图3.1 红灯亮

我:关闭红灯

在这里插入图片描述

图3.2 红灯灭

ASR:好的,马上关闭红灯

    语音识别反应很快,基本上一说完就反应过来。而且声音小的时候也可以反应过来。第一个程序语音识别开灯和关灯,效果还是不错的。


四、总结

    本文介绍了基于TWEN-ASR-ONE开发板,实现的语音识别功能,并且进行控制开灯和关灯操作。整过过程还是比较简单。图形化编程很直观,阅读代码功能对初学者来说,基本上没有什么问题。字符代码,可以让我们过度到图形化代码编程。TWEN-ASR-ONE开发语音识别编程很简单。欢迎词、退出语音、命令识别词、唤醒识别词可以自定义。还可以进行不同声音、音量、语速选择。总体来说,对于DIY功能基本够用。


参考文章:
[1] TWen-ASR-ONE 快速上手说明 V1.0(twen_asr.pdf)

以上是关于TWEN-ASR 语音识别系列教程--- 运行第一个程序的主要内容,如果未能解决你的问题,请参考以下文章

TWEN-ASR ONE 语音识别系列教程--- 运行第一个程序

TWEN-ASR ONE 语音识别系列教程---多线程与消息队列使用

TWEN-ASR ONE 语音识别系列教程---多线程与消息队列使用

TWEN-ASR ONE 语音识别系列教程---多线程与消息队列使用

TWEN-ASR ONE 语音识别系列教程---多线程与消息队列使用

TWEN-ASR ONE 语音识别系列教程--- GPIOADCPWM的使用