国内在线语音方案

Last Updated on : 2024-06-20 08:51:23download

涂鸦国内在线语音方案,目前包含两款基础硬件产品、一款SDK、两种解决方案。开发者可以根据自身业务需求,选择相关产品,高效的开发具有语音能力的智能产品。

分类 具体方案
基础硬件产品 在线语音模组VWXR2
使用SS190语音网关
SDK 接入Linux语音SDK
解决方案 在线语音MCU方案
在线语音SoC免开发方案

在线语音模组VWXR2

涂鸦VWXR2模组在Wi-Fi模组基础上,增加了在线语音拾取、语音播报和语音处理等功能。即VWXR2不仅包含了Wi-Fi模组原有的全部IoT功能,还包含了在线语音功能。

将VWXR2模组内置进IoT设备中,可以实现“Tuya Voice Built-in”和“Works with Tuya Voice”两个能力。即实现用户可以直接语音控制本机设备,实现语音获取云端语音技能,也可以实现语音控制同账号下的其他IoT设备等功能。

硬件规格

VWXR2模组硬件规格如下:

  • VWXR2模组尺寸20mm(W)*30mm(L)*3.6mm(H)
  • VWXR2模组外围仅需外接两个麦克风、一个喇叭、一个按键、一个双色LED,供电后即可独立工作
  • 单核M4,主频380MHz,SRAM 416KB,PSRAM 4MB,Flash 8MB
  • 内置2.4G Wi-Fi,板载天线,预留IPEX天线接口
  • 支持双路麦克风,单路喇叭,内置2.6W音频功放
  • 支持20路以上GPIO;支持UART、IIC、ADC、PWM等接口
  • 支持红蓝双色指示灯、禁麦/配网按键
  • 5V单电源供电,最大峰值电流500mA

应用场景

基于VWXR2模组,开发者可以开发红外语音遥控器、语音面板、语音浴霸、语音窗帘等智能设备。详情可参考在线语音MCU方案、在线语音SoC免开发方案。

SS190语音网关

涂鸦SS190语音网关,是AI音箱、红外遥控器、Zigbee网关三合一的智能语音网关。不仅有AI音箱上丰富的音乐资源/故事/儿童节目等,还能通过红外遥控红外家电,更能控制搭载Zigbee模块的智能设备。

产品外观

国内在线语音方案

功能特点

  • Wi-Fi 智能音箱+红外网关+Zigbee 网关,3 合 1 形态产品
  • 5 米远场语音、支持普通话。内置“小智管家”唤醒词
  • 内置 Zigbee 3.0 网关,支持百个以上的子设备
  • 内置红外网关,支持市面上绝大多数红外设备
  • 自研 IOT 语音技能,智能控制 Powered by Tuya 设备
  • 支持 QQ 音乐、有声读物、百科、问答等各种丰富内容
  • 一个 APP 实现音箱和 IOT 设备的配网,支持自定义场景和自动化
  • 支持唤醒词定制、语音技能定制、APP 定制、包材定制等各种增值服务
  • 支持固话(运营商版本,如联通、电信)

硬件配置

  • 四核 A35 主控、1.3GHz 主频、128MB flash、128MB DDR3
  • 2.4G Wi-Fi 支持 IEEE 802.11 b/g/n 协议、BT4.2 支持 A2DP 音乐播放
  • Zigbee 3.0 网关功能,实际挂载设备超过 100 个,直线距离超过 100 米
  • 红外控制和红外学习功能,内置 7 颗大功率大角度红外发射管,360 度空间覆盖,有效控制距离约 10 米
  • 5 个按键、音量+、音量-、播放/暂停、禁麦、按键唤醒。红蓝指示灯
  • 4 个硅麦阵列,2.0 inch、3W、4 OHM 全频喇叭
  • 5V2A、Micro USB 接口供电

应用场景

智能音箱在目前现有的产品中有很多款,但是 SS190 不仅仅具备智能音箱的功能,而且是一款集合多网关功能的智能语音网关。其中多网关内容包括 Wi-Fi、红外、Zigbee 网关功能。在家庭中可以作为一款多网关的代替产品连接不同传输协议的产品。且该款产品成本低、外观靓丽、操作简易,在家庭中有着广泛的应用,对家庭中增量电器和存量电器有着重要的意义。

认证情况

国家无线委员会型号核准(SRRC)及 CCC 认证目前均已通过。

Linux语音SDK

Linux语音SDK为设备端SDK,主要赋予设备连接涂鸦语音服务,实现在线语音识别、在线语音合成、音频录播的能力;搭配第三方前端唤醒算法,开发者可以开发智能音响、语音面板、故事机等智能语音终端产品,同时连接涂鸦IOT平台,可实现免绑定语音控制涂鸦IOT设备的能力,目前涂鸦暂不提供前端唤醒算法能力。

接口能力

  • 语音数据上报,用于将设备录取到的语音数据传上云端做语音识别、语义理解等操作
  • TTS URL下发、音频URL下发、FM广播下发
  • 交互数据下发:ASR文本下发、TTS文本下发、ASR关键字+技能标识下发、设备控制结果状态码下发、技能内容数据下发
  • 内容切换:播放模式、上一首、下一首、播放暂停

在线语音MCU方案

涂鸦在线语音MCU方案基于在线语音模组VWXR2而开发,架构图如下:

国内在线语音方案

在线语音MCU方案对接方式与普通Wi-Fi模组MCU对接类似。VWXR2模组本质上是在基础的Wi-Fi模组上增加了在线语音能力,语音相关的结果数据通过UART可与开发者自有的MCU进行交互,其他开发需求可参考 Wi-Fi模组MCU对接

目前涂鸦在线语音MCU方案已落地在在线语音窗帘、在线语音空调、在线语音浴霸等产品上。

在线语音SoC免开发方案

在线语音SoC免开发方案,开发者只需要基于在线语音模组VWXR2,按需增加对应的外设即可快速的开发出带语音的智能硬件产品。目前涂鸦在线语音SoC方案已落地在红外遥控器、语音面板等产品上。