T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

更新时间：2026-05-28 02:13:02LLM 副本以 Markdown 格式查看下载 PDF

该demo仅供参考

固件验证和修改文件可自行对比

文生图和图生图，配置以下几个地方

1.要创建在对应的产品品类下面

T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

2.DemoInformation.json查看这个文件，看是什么版本，如果是："DemoVersion": "1.0.46",那么需要将：CONFIG_ENABLE_TUYA_CAMERA这个宏全部改为ENABLE_TUYA_CAMERA，不然摄像头没有用，UI上点击拍照用不了。

3.打开AI图片宏，使用长按对话模式（因为生图时间很长，避免被对话打断，看__ai_hold_image这个函数）

T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

4.修改一下本地代码，因为服务器下发的图片不会显示

T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

5.然后拍照，去相册里找到照片，然后点击箭头的那个按键去发送，然后长按按键对话说：将这张图片改成可爱或是严肃风，黑白风（每次要改图片都要上传图片）

T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

下面是扩展知识（与这次修改无关），如果有需要设备模式（闲聊，翻译，生图，侦测，就需要配置下面选项，同时需要专门的智能体配置，要找产品去配置好）：

需要修改配置：

comment "Chat mode scode: MULTIMODAL_CHAT //多模态对话——支持语音+图像输入，云端走完整的 ASR→LLM→TTS 管线，设备可发语音、拍照让 AI 理解并回答

comment "Translate mode scode: REALTIME_TRANSLATION //实时翻译——用户说一句话，云端识别后翻译成目标语言并 TTS 播报，适用于多语种口语翻译场景

comment "Picture mode scode: VOICE_TO_IMAGE //语音生图——用户通过语音描述想要的图片，云端调用文生图模型生成图片返回设备显示

comment "Detection mode scode: MOTION_DETECTION //运动侦测——设备摄像头检测到画面变化时，抓拍图片发给云端 AI 进行分析识别（如识别人/物/异常事件）

T5 SMP版本（3.13.6）上验证文生图（语音生图）和图生图功能

上一篇T5 SMP(3.13.8)版本上设备端修改智能体相关配置demo

下一篇T5 SMP版本（3.13.6，应用版本：1.0.49）上验证翻译模式和侦测模式