更新时间:2026-02-09 10:11:44下载pdf
语音服务相关的协议只适用于语音模组 1302、语音模组 8006 的通用对接,其他非语音模组的通用固件没有以下相关协议功能。
使能通用固件支持 AI 的能力,MCU 必须在设备新功能设置通知命令(0x37 + 0x00)(可选)返回的 JSON 数据中携带 AI 字段,以描述具体配置。
AI 语音能力配置 JSON 示例
"ai": {
"type": 0,
"scode":"aaa",
"mode":0
"wkio": 15,
"wkm": 0,
"wkt": 5,
"spk_io":28,
"vol_in_io":4,
"vol_de_io":5,
"vol_mute_io":6,
"up": [1,2],
"down": [1,2],
"vtype":0,
"mt":60,
"asr": 0,
"rsize":1024,
"ssize":1024
}
| 字段 | 必填 | 说明 |
|---|---|---|
| type | 是 | 硬件方案:
|
| scode | 否 | Soltuion code,字符串 |
| mode | 否 |
|
| wkio | 否 | 针对模组自带语音能力以及模组外挂三方语音芯片的场景,如果需要按键唤醒拾音,此处配置模组的唤醒引脚(默认 12) |
| wkt | 否 | 针对 mode 为 1/2/3 的三种情形,设置唤醒后的超时时间(即 VAD 检测无效,默认 30 秒,范围 30 - 180 秒) |
| spk_io | 否 | 扬声器引脚(默认 28) |
| vol_in_io | 否 | 音量增加引脚(默认 4) |
| vol_de_io | 否 | 音量减少引脚(默认 5) |
| vol_mute_io | 否 | 静音引脚(默认 6) |
| up | 否 | 数组,模组负责上报的上行数据,可以包括多个类型,值为报文类型,如 [0,1] |
| down | 否 | 数组,模组负责处理的下行数据,可以包括多个类型,值为报文类型,如 [1,2] |
| vtype | 否 | 如果上行视频是模组处理的话,要选摄像头的类型
|
| mt | 否 | |
| asr | 否 | 是否接收自动语音识别(Automatic Speech Recognition,ASR)识别后的文本
|
| rsize | 否 | MCU 能接收的每包最大值 |
| ssize | 否 | 模组能接收的每包最大值 |
| pcm | 否 | MCU 是否需要 PCM 音频 |
MCU 发送
| 字段 | 字节数 | 说明 |
|---|---|---|
| 帧头 | 2 | 0x55aa |
| 版本 | 1 | 0x03 |
| 命令字 | 1 | 0x37 |
| 数据长度 | 2 | N |
| 数据 | 1 | 子命令:0x00 |
| n | AI 语音能力配置 JSON | |
| 校验和 | 1 | 从帧头开始,按字节求和,得出的结果对 256 求余 |
示例:

模组返回
| 字段 | 字节数 | 说明 |
|---|---|---|
| 帧头 | 2 | 0x55aa |
| 版本 | 1 | 0x00 |
| 命令字 | 1 | 0x37 |
| 数据长度 | 2 | 0x0002 |
| 数据 | 2 | 数据格式:子命令(0x00)+ 执行结果 其中,执行结果:
|
| 校验和 | 1 | 从帧头开始,按字节求和,得出的结果对 256 求余 |
示例:55 AA 00 37 00 02 00 00 38
该内容对您有帮助吗?
是意见反馈该内容对您有帮助吗?
是意见反馈