国内在线语音方案

更新时间：2024-06-20 08:51:23LLM 副本以 Markdown 格式查看下载 PDF

涂鸦国内在线语音方案，目前包含两款基础硬件产品、一款SDK、两种解决方案。开发者可以根据自身业务需求，选择相关产品，高效的开发具有语音能力的智能产品。

分类	具体方案
基础硬件产品	在线语音模组VWXR2 使用SS190语音网关
SDK	接入Linux语音SDK
解决方案	在线语音MCU方案在线语音SoC免开发方案

在线语音模组VWXR2

涂鸦VWXR2模组在Wi-Fi模组基础上，增加了在线语音拾取、语音播报和语音处理等功能。即VWXR2不仅包含了Wi-Fi模组原有的全部IoT功能，还包含了在线语音功能。

将VWXR2模组内置进IoT设备中，可以实现"Tuya Voice Built-in"和"Works with Tuya Voice"两个能力。即实现用户可以直接语音控制本机设备，实现语音获取云端语音技能，也可以实现语音控制同账号下的其他IoT设备等功能。

硬件规格

VWXR2模组硬件规格如下：

VWXR2模组尺寸20mm（W）*30mm（L）*3.6mm（H）
VWXR2模组外围仅需外接两个麦克风、一个喇叭、一个按键、一个双色LED，供电后即可独立工作
单核M4，主频380MHz，SRAM 416KB，PSRAM 4MB，Flash 8MB
内置2.4G Wi-Fi，板载天线，预留IPEX天线接口
支持双路麦克风，单路喇叭，内置2.6W音频功放
支持20路以上GPIO；支持UART、IIC、ADC、PWM等接口
支持红蓝双色指示灯、禁麦/配网按键
5V单电源供电，最大峰值电流500mA

应用场景

基于VWXR2模组，开发者可以开发红外语音遥控器、语音面板、语音浴霸、语音窗帘等智能设备。详情可参考在线语音MCU方案、在线语音SoC免开发方案。

SS190语音网关

涂鸦SS190语音网关，是AI音箱、红外遥控器、Zigbee网关三合一的智能语音网关。不仅有AI音箱上丰富的音乐资源/故事/儿童节目等，还能通过红外遥控红外家电，更能控制搭载Zigbee模块的智能设备。

产品外观

功能特点

Wi-Fi 智能音箱+红外网关+Zigbee 网关，3 合 1 形态产品
5 米远场语音、支持普通话。内置“小智管家”唤醒词
内置 Zigbee 3.0 网关，支持百个以上的子设备
内置红外网关，支持市面上绝大多数红外设备
自研 IOT 语音技能，智能控制 Powered by Tuya 设备
支持 QQ 音乐、有声读物、百科、问答等各种丰富内容
一个 APP 实现音箱和 IOT 设备的配网，支持自定义场景和自动化
支持唤醒词定制、语音技能定制、APP 定制、包材定制等各种增值服务
支持固话(运营商版本，如联通、电信)

硬件配置

四核 A35 主控、1.3GHz 主频、128MB flash、128MB DDR3
2.4G Wi-Fi 支持 IEEE 802.11 b/g/n 协议、BT4.2 支持 A2DP 音乐播放
Zigbee 3.0 网关功能，实际挂载设备超过 100 个，直线距离超过 100 米
红外控制和红外学习功能，内置 7 颗大功率大角度红外发射管，360 度空间覆盖，有效控制距离约 10 米
5 个按键、音量+、音量-、播放/暂停、禁麦、按键唤醒。红蓝指示灯
4 个硅麦阵列，2.0 inch、3W、4 OHM 全频喇叭
5V2A、Micro USB 接口供电

应用场景

智能音箱在目前现有的产品中有很多款，但是 SS190 不仅仅具备智能音箱的功能，而且是一款集合多网关功能的智能语音网关。其中多网关内容包括 Wi-Fi、红外、Zigbee 网关功能。在家庭中可以作为一款多网关的代替产品连接不同传输协议的产品。且该款产品成本低、外观靓丽、操作简易，在家庭中有着广泛的应用，对家庭中增量电器和存量电器有着重要的意义。

认证情况

国家无线委员会型号核准（SRRC）及 CCC 认证目前均已通过。

Linux语音SDK

Linux语音SDK为设备端SDK，主要赋予设备连接涂鸦语音服务，实现在线语音识别、在线语音合成、音频录播的能力；搭配第三方前端唤醒算法，开发者可以开发智能音响、语音面板、故事机等智能语音终端产品，同时连接涂鸦IOT平台，可实现免绑定语音控制涂鸦IOT设备的能力，目前涂鸦暂不提供前端唤醒算法能力。

接口能力

语音数据上报，用于将设备录取到的语音数据传上云端做语音识别、语义理解等操作
TTS URL下发、音频URL下发、FM广播下发
交互数据下发：ASR文本下发、TTS文本下发、ASR关键字+技能标识下发、设备控制结果状态码下发、技能内容数据下发
内容切换：播放模式、上一首、下一首、播放暂停

在线语音MCU方案

涂鸦在线语音MCU方案基于在线语音模组VWXR2而开发，架构图如下：

国内在线语音方案

在线语音MCU方案对接方式与普通Wi-Fi模组MCU对接类似。VWXR2模组本质上是在基础的Wi-Fi模组上增加了在线语音能力，语音相关的结果数据通过UART可与开发者自有的MCU进行交互，其他开发需求可参考 Wi-Fi模组MCU对接。

目前涂鸦在线语音MCU方案已落地在在线语音窗帘、在线语音空调、在线语音浴霸等产品上。

在线语音SoC免开发方案

在线语音SoC免开发方案，开发者只需要基于在线语音模组VWXR2，按需增加对应的外设即可快速的开发出带语音的智能硬件产品。目前涂鸦在线语音SoC方案已落地在红外遥控器、语音面板等产品上。

结构设计请参考语音模组VWXR2声学结构设计
硬件设计请参考语音模组VWXR2硬件设计指导