T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能

更新时间:2026-05-28 02:13:02LLM 副本以 Markdown 格式查看下载 PDF

该demo仅供参考

固件验证和修改文件可自行对比

文生图和图生图,配置以下几个地方

1.要创建在对应的产品品类下面

T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能

2.DemoInformation.json查看这个文件,看是什么版本,如果是:"DemoVersion": "1.0.46",那么需要将:CONFIG_ENABLE_TUYA_CAMERA这个宏全部改为ENABLE_TUYA_CAMERA,不然摄像头没有用,UI上点击拍照用不了。

3.打开AI图片宏,使用长按对话模式(因为生图时间很长,避免被对话打断,看__ai_hold_image这个函数)

T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能

4.修改一下本地代码,因为服务器下发的图片不会显示

T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能
T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能
T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能

5.然后拍照,去相册里找到照片,然后点击箭头的那个按键去发送,然后长按按键对话说:将这张图片改成可爱或是严肃风,黑白风(每次要改图片都要上传图片)

T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能

下面是扩展知识(与这次修改无关),如果有需要设备模式(闲聊,翻译,生图,侦测,就需要配置下面选项,同时需要专门的智能体配置,要找产品去配置好):

需要修改配置:

comment "Chat mode scode: MULTIMODAL_CHAT //多模态对话——支持语音+图像输入,云端走完整的 ASR→LLM→TTS 管线,设备可发语音、拍照让 AI 理解并回答

comment "Translate mode scode: REALTIME_TRANSLATION //实时翻译——用户说一句话,云端识别后翻译成目标语言并 TTS 播报,适用于多语种口语翻译场景

comment "Picture mode scode: VOICE_TO_IMAGE //语音生图——用户通过语音描述想要的图片,云端调用文生图模型生成图片返回设备显示

comment "Detection mode scode: MOTION_DETECTION //运动侦测——设备摄像头检测到画面变化时,抓拍图片发给云端 AI 进行分析识别(如识别人/物/异常事件)

T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能
T5 SMP版本(3.13.6)上验证文生图(语音生图)和 图生图功能