智能体计量计费

更新时间:2026-06-15 08:12:31LLM 副本以 Markdown 格式查看下载 PDF

本文将详细介绍智能体的各计费项及相关费用。

资源点

平台使用 资源点 作为统一的 计费单位。用户需先通过增值服务购买资源点,后续根据实际消耗量扣除对应资源点。

计费周期

平台会按照实际消耗量结算每天产生的资源点。账单出账时间通常在当前计费周期结束后两天,具体出账时间以系统为准。

费用构成

智能体采用按需计费模式,遵循公式:
总费用 = 模型费用 + AI 语音费用 + 拓展能力费用 - 减免费用

关于各项费用的详细介绍,请参考下文。

模型费用

模型类型

如何区分模型类型,可参考 可用模型

计费公式

模型服务根据模型的 Token 使用量计费,计费公式如下:

模型费用 = Token 使用量 × 模型单价

在大语言模型中,Token 是文本处理的计量单位。模型通常将输入文本分解成一系列 Token,然后对这些 Token 进行处理和分析。Token 可以是单词、字符、子词片段或其他形式的文本片段,具体的划分方式取决于模型使用的分词算法,所以 Token 的计算和处理方式可能会根据模型的具体架构和设计而有所不同。

单价

Qwen

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
Qwen-Max 输入 2.50 ¥2.50
Qwen-Max 输出 10.00 ¥10.00
Qwen-Turbo-Latest 输入 0.36 ¥0.36
Qwen-Turbo-Latest 输出 1.40 ¥1.40
Qwen3-32b 输入 0.75 ¥0.75
Qwen3-32b 输出 7.50 ¥7.50
Qwen3-Max 输入 2.50 ¥2.50
Qwen3-Max 输出 10.00 ¥10.00
Qwen-Flash 输入 0.15 ¥0.15
Qwen-Flash 输出 1.50 ¥1.50
Qwen-Plus 输入 0.80 ¥0.80
Qwen-Plus 输出 2.00 ¥2.00

Doubao

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
Doubao-Seed-1.6-flash 输入 0.30 ¥0.30
Doubao-Seed-1.6-flash 输出 3.00 ¥3.00
Doubao-Seed-1.6 输入 0.80 ¥0.80
Doubao-Seed-1.6 输出 2.00 ¥2.00
Doubao-Seed-1.8 输入 0.80 ¥0.80
Doubao-Seed-1.8 输出 2.00 ¥2.00
Doubao-Seed-2.0-mini 输入 0.20 ¥0.20
Doubao-Seed-2.0-mini 输出 2.00 ¥2.00
Doubao-Seed-2.0-Pro 输入 3.20 ¥3.20
Doubao-Seed-2.0-Pro 输出 16.00 ¥16.00

DeepSeek

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
DeepSeek v3 输入 0.20 ¥0.20
DeepSeek v3 输出 3.00 ¥3.00

MiniMax

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
MiniMax-M2.7 输入 2.20 ¥2.20
MiniMax-M2.7 输出 8.70 ¥8.70

ChatGPT

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
GPT-4o 输入 16.67 $2.50
GPT-4o 输出 66.67 $10.00
GPT-4o-mini 输入 1.00 $0.15
GPT-4o-mini 输出 4.00 $0.60
GPT-5 输入 8.34 $1.25
GPT-5 输出 66.67 $10.00
GPT-5-mini 输入 1.67 $0.25
GPT-5-mini 输出 13.34 $2.00
GPT-5-nano 输入 0.33 $0.05
GPT-5-nano 输出 2.67 $0.40
GPT-5.1 输入 8.34 $1.25
GPT-5.1 输出 66.67 $10.00
GPT-5.2 输入 11.67 $1.75
GPT-5.2 输出 93.40 $14.00
GPT-5.4 输入 33.35 $5.00
GPT-5.4 输出 200.00 $30.00
GPT-5.4-mini 输入 5.00 $0.75
GPT-5.4-mini 输出 30.00 $4.50
GPT-5.4-nano 输入 1.33 $0.20
GPT-5.4-nano 输出 8.34 $1.25

Gemini

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
Gemini-2.0-Flash 输入 0.67 $0.10
Gemini-2.0-Flash 输出 2.67 $0.40
Gemini-2.5-Pro 输入 8.40 $1.25
Gemini-2.5-Pro 输出 66.67 $10.00
Gemini-2.5-Flash 输入 2.00 $0.30
Gemini-2.5-Flash 输出 16.65 $2.50
Gemini-3-Flash 输入 3.34 $0.50
Gemini-3-Flash 输出 20.00 $3.00
Gemini-3.1-Pro 输入 13.34 $2.00
Gemini-3.1-Pro 输出 80.00 $12.00

Mistral

计费项 消耗资源点/每百万 Token 对应金额/每百万 Token
Mistral-Large-Latest 输入 53.36 $8.00
Mistral-Large-Latest 输出 160 $24.00

AI 语音费用

计费公式

AI 语音分为语音输入(Automatic Speech Recognization,ASR)和语音输出(Text-to-Speech,TTS)两部分,计费公式如下:

  • ASR 费用 = ASR 单价 × 输入音频时长
  • TTS 费用 = TTS 单价 × 输出音频字符数
  • ASR:能够识别和理解人类的自然音频语言输入的技术,通过分析和处理语音信号,从而实现将音频转化为文本。
  • TTS:能够将文本转换成语音输出的技术,模拟人类进行朗读,从而实现将文字信息转变为音频信息。

单价

ASR 厂商 ASR 模型 消耗资源点/每小时 对应金额/每小时
ALIYUN paraformer-realtime-v2 0.13 ¥0.13
TENCENT 16k_zh_en 3.20 ¥3.20
VOLCANO volcengine_streaming_common 3.50 ¥3.50
VOLCANO bigmodel 4.50 ¥4.50
AZURE azure-stt-standard 6.67 $1.00
ELEVENLABS scribe_v1_experimental 1.47 $0.22

TTS 厂商 TTS 模型 消耗资源点/每千字符 对应金额/每千字符
ALIYUN cosyvoice-v3-plus 2.00 ¥2.00
ALIYUN cosyvoice-v3-flash 1.00 ¥1.00
TENCENT default 9.00 ¥9.00
VOLCANO seed-tts-1.0 5.00 ¥5.00
VOLCANO seed-tts-2.0 3.00 ¥3.00
AZURE neural 100.00 $15.00
AZURE multilingual-neural 100.00 $15.00
AZURE dragon-hd-latest 146.67 $22.00
AZURE dragon-hd-flash 146.67 $22.00
GOOGLE chirp3-hd 200.00 $30.00
GOOGLE studio 1066.72 $160.00
GOOGLE neural2 106.67 $16.00
GOOGLE wavenet 26.67 $4.00
GOOGLE polyglot 106.67 $16.00
GOOGLE standard 26.67 $4.00
MINIMAX speech-02-turbo 2.00 ¥2.00

拓展能力费用

根据您的智能体配置,除 AI 基础资源消耗外,您的产品可能需要具备其他 AI 扩展能力。
配置方式:

使用音色复刻的 TTS 费用

如图所示,在为智能体开启并发布 音色复刻 功能后,即可支持用户通过复刻音色进行语音交互。后续将根据该对话过程的实际调用量,产生相应的费用。

智能体计量计费
厂商 模型 消耗资源点/每万字符 对应金额/每万字符
VOLCANO seed-icl-1.0 8.00 ¥8.00
ALIYUN cosyvoice-v3-plus 2.00 ¥2.00
ALIYUN cosyvoice-v3-flash 1.00 ¥1.00
AZURE DragonLatestNeural 146.67 $22.00
GOOGLE google-voice-clone 400.00 $60.00

AI 生成图片费用

如图所示,为工作流配置并发布 图像生成 节点后,即可赋予智能体生成图片的能力。后续将根据该图像生成操作的实际调用量,产生相应的费用。

此节点即将开放,敬请期待。

智能体计量计费
厂商 模型/能力 消耗资源点/张 对应金额/张
VOLCANO doubao-seedream-4.0 0.20 ¥0.20
VOLCANO doubao-seedream-5.0-lite 0.22 ¥0.22
ALIYUN z-image-turbo 0.10 ¥0.10
GOOGLE gemini-2.5-flash-image 0.27 $0.04

联网搜索费用

如图所示,为智能体或工作流配置并发布 联网搜索 工具后,即可赋予其检索实时网络信息的能力。后续将根据该搜索操作(如查询当日新闻等)的实际调用量,产生相应费用。

智能体计量计费
厂商 模型/能力 消耗资源点/千次 对应金额/千次
VOLCANO 火山 Colab(后付费) 30.00 ¥30.00
BRAVE brave 53.34 $8.00

历史会话总结费用

如图所示,为智能体开启并发布 历史会话总结 功能后,将具备分析历史对话的能力。后续该能力根据调用量,产生相应费用。

智能体计量计费
厂商 模型/能力 计费项 消耗资源点/百万 Token 对应金额/百万 Token
ALIYUN qwen-plus 输入 0.80 ¥0.80
ALIYUN qwen-plus 输出 2.00 ¥2.00
GOOGLE gemini-2.5-pro 输入 8.33 $1.25
GOOGLE gemini-2.5-pro 输出 66.67 $10.00

事件记忆费用

如图所示,为智能体开启并发布 会话事件记忆 功能后,智能体即可长期记住事件历史,从而实现 记得很久之前发生过什么 的连续对话体验。后续该功能根据调用量,产生相应费用。

智能体计量计费
厂商 模型/能力 计费项 消耗资源点/百万 Token 对应金额/百万 Token
ALIYUN qwen3-max 输入 2.50 ¥2.50
ALIYUN qwen3-max 输出 10.00 ¥10.00
OPENAI gpt-5.1 输入 8.33 $1.25
OPENAI gpt-5.1 输出 66.67 $10.00

减免费用

如果智能体投放到设备进行直连,存在以下费用减免:

AI 基础减免

若您在开发产品时已开启 AI 智能体接入 高级功能,在设备每日产生费用消耗时将会减免掉一定额度,减免额度为 0.5 资源点/日。当减免额度用尽后,每日的超量消耗将进行计费。

智能体计量计费

订阅模式减免

若您将对应产品加入到 订阅模式,涂鸦会提供设备端统一的订阅套餐、权益发放、使用量统计等,您的产品可以获得 AI 基础减免之外的继续减免,最终实现全额减免。