智能体计量计费

更新时间：2026-06-15 08:12:31LLM 副本以 Markdown 格式查看下载 PDF

本文将详细介绍智能体的各计费项及相关费用。

资源点

平台使用 资源点 作为统一的 计费单位。用户需先通过增值服务购买资源点，后续根据实际消耗量扣除对应资源点。

计费周期

平台会按照实际消耗量结算每天产生的资源点。账单出账时间通常在当前计费周期结束后两天，具体出账时间以系统为准。

费用构成

智能体采用按需计费模式，遵循公式：
总费用 = 模型费用 + AI 语音费用 + 拓展能力费用 - 减免费用

关于各项费用的详细介绍，请参考下文。

模型费用

模型类型

如何区分模型类型，可参考可用模型。

计费公式

模型服务根据模型的 Token 使用量计费，计费公式如下：

模型费用 = Token 使用量 × 模型单价

在大语言模型中，Token 是文本处理的计量单位。模型通常将输入文本分解成一系列 Token，然后对这些 Token 进行处理和分析。Token 可以是单词、字符、子词片段或其他形式的文本片段，具体的划分方式取决于模型使用的分词算法，所以 Token 的计算和处理方式可能会根据模型的具体架构和设计而有所不同。

单价

Qwen

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
Qwen-Max 输入	2.50	¥2.50
Qwen-Max 输出	10.00	¥10.00
Qwen-Turbo-Latest 输入	0.36	¥0.36
Qwen-Turbo-Latest 输出	1.40	¥1.40
Qwen3-32b 输入	0.75	¥0.75
Qwen3-32b 输出	7.50	¥7.50
Qwen3-Max 输入	2.50	¥2.50
Qwen3-Max 输出	10.00	¥10.00
Qwen-Flash 输入	0.15	¥0.15
Qwen-Flash 输出	1.50	¥1.50
Qwen-Plus 输入	0.80	¥0.80
Qwen-Plus 输出	2.00	¥2.00

Doubao

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
Doubao-Seed-1.6-flash 输入	0.30	¥0.30
Doubao-Seed-1.6-flash 输出	3.00	¥3.00
Doubao-Seed-1.6 输入	0.80	¥0.80
Doubao-Seed-1.6 输出	2.00	¥2.00
Doubao-Seed-1.8 输入	0.80	¥0.80
Doubao-Seed-1.8 输出	2.00	¥2.00
Doubao-Seed-2.0-mini 输入	0.20	¥0.20
Doubao-Seed-2.0-mini 输出	2.00	¥2.00
Doubao-Seed-2.0-Pro 输入	3.20	¥3.20
Doubao-Seed-2.0-Pro 输出	16.00	¥16.00

DeepSeek

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
DeepSeek v3 输入	0.20	¥0.20
DeepSeek v3 输出	3.00	¥3.00

MiniMax

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
MiniMax-M2.7 输入	2.20	¥2.20
MiniMax-M2.7 输出	8.70	¥8.70

ChatGPT

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
GPT-4o 输入	16.67	$2.50
GPT-4o 输出	66.67	$10.00
GPT-4o-mini 输入	1.00	$0.15
GPT-4o-mini 输出	4.00	$0.60
GPT-5 输入	8.34	$1.25
GPT-5 输出	66.67	$10.00
GPT-5-mini 输入	1.67	$0.25
GPT-5-mini 输出	13.34	$2.00
GPT-5-nano 输入	0.33	$0.05
GPT-5-nano 输出	2.67	$0.40
GPT-5.1 输入	8.34	$1.25
GPT-5.1 输出	66.67	$10.00
GPT-5.2 输入	11.67	$1.75
GPT-5.2 输出	93.40	$14.00
GPT-5.4 输入	33.35	$5.00
GPT-5.4 输出	200.00	$30.00
GPT-5.4-mini 输入	5.00	$0.75
GPT-5.4-mini 输出	30.00	$4.50
GPT-5.4-nano 输入	1.33	$0.20
GPT-5.4-nano 输出	8.34	$1.25

Gemini

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
Gemini-2.0-Flash 输入	0.67	$0.10
Gemini-2.0-Flash 输出	2.67	$0.40
Gemini-2.5-Pro 输入	8.40	$1.25
Gemini-2.5-Pro 输出	66.67	$10.00
Gemini-2.5-Flash 输入	2.00	$0.30
Gemini-2.5-Flash 输出	16.65	$2.50
Gemini-3-Flash 输入	3.34	$0.50
Gemini-3-Flash 输出	20.00	$3.00
Gemini-3.1-Pro 输入	13.34	$2.00
Gemini-3.1-Pro 输出	80.00	$12.00

Mistral

计费项	消耗资源点/每百万 Token	对应金额/每百万 Token
Mistral-Large-Latest 输入	53.36	$8.00
Mistral-Large-Latest 输出	160	$24.00

AI 语音费用

计费公式

AI 语音分为语音输入（Automatic Speech Recognization，ASR）和语音输出（Text-to-Speech，TTS）两部分，计费公式如下：

ASR 费用 = ASR 单价 × 输入音频时长
TTS 费用 = TTS 单价 × 输出音频字符数

ASR：能够识别和理解人类的自然音频语言输入的技术，通过分析和处理语音信号，从而实现将音频转化为文本。
TTS：能够将文本转换成语音输出的技术，模拟人类进行朗读，从而实现将文字信息转变为音频信息。

单价

ASR 厂商	ASR 模型	消耗资源点/每小时	对应金额/每小时
ALIYUN	paraformer-realtime-v2	0.13	¥0.13
TENCENT	16k_zh_en	3.20	¥3.20
VOLCANO	volcengine_streaming_common	3.50	¥3.50
VOLCANO	bigmodel	4.50	¥4.50
AZURE	azure-stt-standard	6.67	$1.00
ELEVENLABS	scribe_v1_experimental	1.47	$0.22

TTS 厂商	TTS 模型	消耗资源点/每千字符	对应金额/每千字符
ALIYUN	cosyvoice-v3-plus	2.00	¥2.00
ALIYUN	cosyvoice-v3-flash	1.00	¥1.00
TENCENT	default	9.00	¥9.00
VOLCANO	seed-tts-1.0	5.00	¥5.00
VOLCANO	seed-tts-2.0	3.00	¥3.00
AZURE	neural	100.00	$15.00
AZURE	multilingual-neural	100.00	$15.00
AZURE	dragon-hd-latest	146.67	$22.00
AZURE	dragon-hd-flash	146.67	$22.00
GOOGLE	chirp3-hd	200.00	$30.00
GOOGLE	studio	1066.72	$160.00
GOOGLE	neural2	106.67	$16.00
GOOGLE	wavenet	26.67	$4.00
GOOGLE	polyglot	106.67	$16.00
GOOGLE	standard	26.67	$4.00
MINIMAX	speech-02-turbo	2.00	¥2.00

拓展能力费用

根据您的智能体配置，除 AI 基础资源消耗外，您的产品可能需要具备其他 AI 扩展能力。
配置方式：

我的智能体 > 开发版本 > 模型能力配置
工作流管理平台

使用音色复刻的 TTS 费用

如图所示，在为智能体开启并发布 音色复刻 功能后，即可支持用户通过复刻音色进行语音交互。后续将根据该对话过程的实际调用量，产生相应的费用。

厂商	模型	消耗资源点/每万字符	对应金额/每万字符
VOLCANO	seed-icl-1.0	8.00	¥8.00
ALIYUN	cosyvoice-v3-plus	2.00	¥2.00
ALIYUN	cosyvoice-v3-flash	1.00	¥1.00
AZURE	DragonLatestNeural	146.67	$22.00
GOOGLE	google-voice-clone	400.00	$60.00

AI 生成图片费用

如图所示，为工作流配置并发布 图像生成 节点后，即可赋予智能体生成图片的能力。后续将根据该图像生成操作的实际调用量，产生相应的费用。

此节点即将开放，敬请期待。

厂商	模型/能力	消耗资源点/张	对应金额/张
VOLCANO	doubao-seedream-4.0	0.20	¥0.20
VOLCANO	doubao-seedream-5.0-lite	0.22	¥0.22
ALIYUN	z-image-turbo	0.10	¥0.10
GOOGLE	gemini-2.5-flash-image	0.27	$0.04

联网搜索费用

如图所示，为智能体或工作流配置并发布 联网搜索 工具后，即可赋予其检索实时网络信息的能力。后续将根据该搜索操作（如查询当日新闻等）的实际调用量，产生相应费用。

厂商	模型/能力	消耗资源点/千次	对应金额/千次
VOLCANO	火山 Colab（后付费）	30.00	¥30.00
BRAVE	brave	53.34	$8.00

历史会话总结费用

如图所示，为智能体开启并发布 历史会话总结 功能后，将具备分析历史对话的能力。后续该能力根据调用量，产生相应费用。

厂商	模型/能力	计费项	消耗资源点/百万 Token	对应金额/百万 Token
ALIYUN	qwen-plus	输入	0.80	¥0.80
ALIYUN	qwen-plus	输出	2.00	¥2.00
GOOGLE	gemini-2.5-pro	输入	8.33	$1.25
GOOGLE	gemini-2.5-pro	输出	66.67	$10.00

事件记忆费用

如图所示，为智能体开启并发布 会话事件记忆 功能后，智能体即可长期记住事件历史，从而实现 记得很久之前发生过什么 的连续对话体验。后续该功能根据调用量，产生相应费用。

厂商	模型/能力	计费项	消耗资源点/百万 Token	对应金额/百万 Token
ALIYUN	qwen3-max	输入	2.50	¥2.50
ALIYUN	qwen3-max	输出	10.00	¥10.00
OPENAI	gpt-5.1	输入	8.33	$1.25
OPENAI	gpt-5.1	输出	66.67	$10.00

减免费用

如果智能体投放到设备进行直连，存在以下费用减免：

AI 基础减免

若您在开发产品时已开启 AI 智能体接入 高级功能，在设备每日产生费用消耗时将会减免掉一定额度，减免额度为 0.5 资源点/日。当减免额度用尽后，每日的超量消耗将进行计费。

智能体计量计费

订阅模式减免

若您将对应产品加入到 订阅模式，涂鸦会提供设备端统一的订阅套餐、权益发放、使用量统计等，您的产品可以获得 AI 基础减免之外的继续减免，最终实现全额减免。

上一篇智能体投放及费用

下一篇AI 能力扩展包：订阅服务说明