语音服务

更新时间:2026-02-09 10:11:44下载pdf

语音服务相关的协议只适用于语音模组 1302、语音模组 8006 的通用对接,其他非语音模组的通用固件没有以下相关协议功能。

基础指令

AI 语音能力配置(0x37 + 0x00)

使能通用固件支持 AI 的能力,MCU 必须在设备新功能设置通知命令(0x37 + 0x00)(可选)返回的 JSON 数据中携带 AI 字段,以描述具体配置。

AI 语音能力配置 JSON 示例

"ai": {
  "type": 0,
  "scode":"aaa",
  "mode":0
  "wkio": 15,
  "wkm": 0,
  "wkt": 5,
  "spk_io":28,
  "vol_in_io":4,
  "vol_de_io":5,
  "vol_mute_io":6,
  "up": [1,2], 
  "down": [1,2],
  "vtype":0,
  "mt":60,
  "asr": 0,
  "rsize":1024,
  "ssize":1024
}
字段 必填 说明
type 硬件方案:
  • 0:MCU 自处理
  • 1:模组自处理
  • 2:模组与 MCU 配合
scode Soltuion code,字符串
mode
  • 0:长按键对话模式
  • 1:按键打断对话模式
  • 2:关键词唤醒对话模式
  • 3:随意打断对话模式
wkio 针对模组自带语音能力以及模组外挂三方语音芯片的场景,如果需要按键唤醒拾音,此处配置模组的唤醒引脚(默认 12)
wkt 针对 mode 为 1/2/3 的三种情形,设置唤醒后的超时时间(即 VAD 检测无效,默认 30 秒,范围 30 - 180 秒)
spk_io 扬声器引脚(默认 28)
vol_in_io 音量增加引脚(默认 4)
vol_de_io 音量减少引脚(默认 5)
vol_mute_io 静音引脚(默认 6)
up 数组,模组负责上报的上行数据,可以包括多个类型,值为报文类型,如 [0,1]
down 数组,模组负责处理的下行数据,可以包括多个类型,值为报文类型,如 [1,2]
vtype 如果上行视频是模组处理的话,要选摄像头的类型
  • 0:DVP(带 USB)
  • 1:UVC(板载自带)
mt
  • 有音频时麦克最大拾音时间
  • 有视频时最长上传时间
  • 默认 60 秒,范围 30 - 60 秒
    asr 是否接收自动语音识别(Automatic Speech Recognition,ASR)识别后的文本
    • 0:不接收
    • 1:接收(默认)
    rsize MCU 能接收的每包最大值
    ssize 模组能接收的每包最大值
    pcm MCU 是否需要 PCM 音频

    MCU 发送

    字段 字节数 说明
    帧头 2 0x55aa
    版本 1 0x03
    命令字 1 0x37
    数据长度 2 N
    数据 1 子命令:0x00
    n AI 语音能力配置 JSON
    校验和 1 从帧头开始,按字节求和,得出的结果对 256 求余

    示例

    55 AA 03 37 00 DA 00 7B 22 62 5F 6E 6D 22 3A 22 22 2C 22 61 69 22 3A 7B 22 74 79 70 65 22 3A 31 2C 22 77 6B 69 6F 22 3A 35 2C 22 73 70 6B 5F 69 6F 22 3A 32 38 2C 22 76 6F 6C 5F 69 6E 5F 69 6F 22 3A 32 32 2C 22 76 6F 6C 5F 64 65 5F 69 6F 22 3A 32 33 2C 22 77 6B 74 22 3A 33 30 2C 22 75 70 22 3A 5B 31 5D 2C 22 64 6F 77 6E 22 3A 5B 31 5D 2C 22 61 73 72 22 3A 31 2C 22 70 63 6D 22 3A 30 2C 22 72 73 69 7A 65 22 3A 36 31 34 34 2C 22 73 73 69 7A 65 22 3A 31 30 32 34 2C 22 6D 6F 64 65 22 3A 32 2C 22 6D 74 22 3A 36 30 2C 22 76 6F 6C 5F 6D 75 74 65 5F 69 6F 22 3A 32 36 7D 2C 22 73 62 75 73 22 3A 7B 22 70 6F 72 74 22 3A 30 2C 22 70 72 6F 74 22 3A 30 2C 22 63 73 22 3A 30 7D 7D F0

    模组返回

    字段 字节数 说明
    帧头 2 0x55aa
    版本 1 0x00
    命令字 1 0x37
    数据长度 2 0x0002
    数据 2 数据格式:子命令(0x00)+ 执行结果
    其中,执行结果:
    • 0x00:成功
    • 0x01:数据字段内容不合法
    • 0x02:设置执行失败
    校验和 1 从帧头开始,按字节求和,得出的结果对 256 求余

    示例55 AA 00 37 00 02 00 00 38