模型价格

本页用于展示不同类型模型的计费方式与限制，方便你在接入与成本评估时快速对照。请以模型市场为准,文档具有滞后性。

更新时间: 2026-06-02

厂商	模型	适用范围	计费明细	最大输出	上下文
OpenAI	GPT-5.4 gpt-5.4	输入 Tokens < 272K	输入2.5$/百万 Token 输出15$/百万 Token 缓存读取0.25$/百万 Token	128K	1.05M
	GPT-5.4 gpt-5.4	输入 Tokens >= 272K	输入5$/百万 Token 输出22.5$/百万 Token 缓存读取0.5$/百万 Token	128K	1.05M
	GPT-5.4-Pro	输入 Tokens < 272K	输入30$/百万 Token 输出180$/百万 Token	128K	1.05M
	GPT-5.4-Pro	输入 Tokens >= 272K	输入60$/百万 Token 输出270$/百万 Token	128K	1.05M
	GPT-5.5 gpt-5.5	输入 Tokens < 272K	输入5$/百万 Token 输出30$/百万 Token 缓存读取0.5$/百万 Token	-	-
	GPT-5.5 gpt-5.5	输入 Tokens >= 272K	输入10$/百万 Token 输出45$/百万 Token 缓存读取1$/百万 Token	-	-
Anthropic	Claude-Sonnet-4.6 claude-sonnet-4.6	默认档	输入3$/百万 Token 输出15$/百万 Token 缓存写入 (5m)3.75$/百万 Token 缓存写入 (1h)6$/百万 Token 缓存读取0.3$/百万 Token	200K	128K
	Claude-Opus-4.5 claude-opus-4.5	默认档	输入5$/百万 Token 输出25$/百万 Token 缓存读取0.5$/百万 Token 缓存写入 (5m)6.25$/百万 Token 缓存写入 (1h)10$/百万 Token	200K	64K
	Claude-Sonnet-4.5 claude-sonnet-4.5	输入 Tokens <= 200K	输入3$/百万 Token 输出15$/百万 Token 缓存写入 (5m)3.75$/百万 Token 缓存写入 (1h)6$/百万 Token 缓存读取0.3$/百万 Token	64K	200K
	Claude-Sonnet-4.5 claude-sonnet-4.5	输入 Tokens > 200K	输入6$/百万 Token 输出22.5$/百万 Token 缓存写入 (5m)7.5$/百万 Token 缓存写入 (1h)12$/百万 Token 缓存读取0.6$/百万 Token	64K	200K
	Claude-Haiku-4.5 claude-haiku-4.5	默认档	输入1$/百万 Token 输出5$/百万 Token 缓存写入 (5m)1.25$/百万 Token 缓存写入 (1h)2$/百万 Token 缓存读取0.1$/百万 Token	-	-
Google	Gemini-3.1-Pro gemini-3.1-pro	输入 Tokens <= 200K	输入2$/百万 Token 输出12$/百万 Token 缓存读取0.2$/百万 Token	64K	1M
	Gemini-3.1-Pro gemini-3.1-pro	输入 Tokens > 200K	输入4$/百万 Token 输出18$/百万 Token 缓存读取0.4$/百万 Token	64K	1M
	Gemini-3-Flash gemini-3-flash	默认档	输入0.5$/百万 Token 输出3$/百万 Token 缓存读取0.05$/百万 Token	64K	1M
DeepSeek	DeepSeek-V3.2	默认档	输入0.3$/百万 Token 输出0.5$/百万 Token	32K	128K
	DeepSeek-V3.2-Thinking	默认档	输入0.3$/百万 Token 输出0.5$/百万 Token	32K	128K
	DeepSeek-R1	默认档	输入0.6$/百万 Token 输出2.4$/百万 Token	28K	128K
	DeepSeek-V4-Flash deepseek-v4-flash	默认档	输入0.18$/百万 Token 输出0.32$/百万 Token 缓存读取0.0036$/百万 Token	-	-
	DeepSeek-V4-Pro deepseek-v4-pro	默认档	输入2$/百万 Token 输出3.8$/百万 Token 缓存读取0.02$/百万 Token	-	-
Alibaba	Qwen3-32B qwen3-32b	默认档	输入0.284$/百万 Token 输出1.136$/百万 Token	32K	32K
	Qwen3-32B-Thinking qwen3-32b-thinking	默认档	输入0.284$/百万 Token 输出2.84$/百万 Token	32K	32K
	Qwen3-coder-plus qwen3-coder-plus	输入 Tokens <= 32K	输入0.574$/百万 Token 输出2.294$/百万 Token 缓存读取0.115$/百万 Token	63K	1M
		输入 Tokens <= 128K 且输入 Tokens > 32K	输入0.861$/百万 Token 输出3.441$/百万 Token 缓存读取0.173$/百万 Token
		输入 Tokens <= 256K 且输入 Tokens > 128K	输入1.434$/百万 Token 输出5.735$/百万 Token 缓存读取0.287$/百万 Token
		输入 Tokens > 256K	输入2.868$/百万 Token 输出28.671$/百万 Token 缓存读取0.574$/百万 Token
	Qwen3-8B qwen3-8b	默认档	输入0.18$/百万 Token 输出0.7$/百万 Token	-	-
MiniMax	MiniMax-M2.5	默认档	输入0.304$/百万 Token 输出1.213$/百万 Token 缓存读取0.061$/百万 Token	-	-
Moonshot	Kimi-K2.5	默认档	输入0.574$/百万 Token 输出3.011$/百万 Token 缓存读取0.115$/百万 Token	32K	256K
xAI	Grok-3	默认档	输入3$/百万 Token 输出15$/百万 Token	-	131K
Zhipu	GLM-5	输入 Tokens <= 32K	输入0.573$/百万 Token 输出2.58$/百万 Token 缓存读取0.115$/百万 Token	128K	200K
Zhipu	GLM-5	输入 Tokens > 32K	输入0.86$/百万 Token 输出3.154$/百万 Token 缓存读取0.172$/百万 Token	128K	200K
ByteDance	bytedance-seed-2.0-lite	输入 Tokens < 128K	输入0.25$/百万 Token 输出2$/百万 Token 缓存读取0.05$/百万 Token	128K	256K
ByteDance	bytedance-seed-2.0-lite	输入 Tokens > 128K	输入0.5$/百万 Token 输出4$/百万 Token 缓存读取0.1$/百万 Token	128K	256K
OPEAI	gemma-4	默认档	输入0.85$/百万 Token 输出0.85$/百万 Token	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
OpenAI	GPT-5.3-Codex gpt-5.3-codex	输入 Tokens < 272K	输入1.75$/百万 Token 输出14$/百万 Token 缓存读取0.175$/百万 Token	128K	400K
Anthropic	Claude-Opus-4.6 claude-opus-4.6	默认档	输入5$/百万 Token 输出25$/百万 Token 缓存写入 (5m)6.25$/百万 Token 缓存写入 (1h)10$/百万 Token 缓存读取0.5$/百万 Token	128K	200K
Anthropic	Claude-Opus-4.7 claude-opus-4.7	默认档	输入5$/百万 Token 输出25$/百万 Token 缓存写入 (5m)6.25$/百万 Token 缓存写入 (1h)10$/百万 Token 缓存读取0.5$/百万 Token	-	-
Alibaba	Qwen3-Coder-Next qwen3-coder-next	输入 Tokens <= 32K	输入0.3$/百万 Token 输出1.5$/百万 Token	-	-
		输入 Tokens <= 128K 且输入 Tokens > 32K	输入0.5$/百万 Token 输出2.5$/百万 Token
		输入 Tokens <= 256K 且输入 Tokens > 128K	输入0.8$/百万 Token 输出4$/百万 Token

厂商	模型	适用范围	计费明细	最大输出	上下文
Alibaba	Qwen-Image	默认档	图片1$/张	-	-
	Qwen-Image-2.0 qwen-image-2.0	默认档	图片0.035$/张	-	-
	wan2.6-image	默认档	图片0.03$/张	-	-
	wan2.6-t2i	默认档	图片0.03$/张	-	-
ByteDance	Doubao-Seedream-4.5	默认档	图片0.05$/张	-	-
	Doubao-Seedream-3.0	默认档	图片0.03$/张	-	-
	bytedance-seedream-5.0	默认档	图片0.035$/张	-	-
Google	Nano Banana 2	默认档	图片0.16$/张	-	-
OpenAI	GPT-Image-2 gpt-image-2	默认档	文本输入5$/百万 Token 图片输入8$/百万 Token 输出30$/百万 Token	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
ByteDance	bytedance-seedance-1.5	默认档	视频 (有声)2.4$/百万 Token 视频 (静音)1.2$/百万 Token	-	-
	seedance-2-0-nsfw	视频分辨率 <= 720	输出（无视频输入）7.72$/百万 Token 输出（有视频输入）4.75$/百万 Token	-	-
	seedance-2-0-nsfw	视频分辨率 <= 1.08K 且视频分辨率 > 720	输出（无视频输入）8.49$/百万 Token 输出（有视频输入）5.19$/百万 Token	-	-
OpenAI	sora-2	默认档	视频0.1$/秒	-	-
Kling	kling-v3	默认档	视频（有声）0.133$/秒视频（静音）0.089$/秒	-	-
Alibaba	wan2.6-i2v	默认档	视频0.15$/秒	-	-
Alibaba	wan2.7-i2v	默认档	视频0.15$/秒	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
OPEAI	AudioLLM/Spark	默认档	输入1.6$/百万 Token 输出1.6$/百万 Token	-	-
OPEAI	AudioLLM/Voice1.0	默认档	输入1.8$/百万 Token 输出3.6$/百万 Token	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
OPEAI	AudioLLM/Voice2.0	默认档	输入1.5$/百万 Token 输出3$/百万 Token	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
OPEAI	MLModel1.5	默认档	输入1$/百万 Token 输出2$/百万 Token	-	-
	MTModel1.0	默认档	输入1.4$/百万 Token 输出1.4$/百万 Token	-	-
	translate-2.0	输入 Tokens < 272K	输入2.5$/百万 Token 输出15$/百万 Token 缓存读取0.25$/百万 Token	-	-
	translate-2.0	输入 Tokens >= 272K	输入5$/百万 Token 输出22.5$/百万 Token 缓存读取0.5$/百万 Token	-	-
	translate-fast-2.0	默认档	输入1$/百万 Token 输出5$/百万 Token 缓存写入 (5m)1.25$/百万 Token 缓存写入 (1h)2$/百万 Token 缓存读取0.1$/百万 Token	-	-
Tencent	Tencent/MT-Hunyuan-7B	默认档	输入1$/百万 Token 输出1$/百万 Token	-	-
Tencent	hy-mt2	默认档	输入0.5$/百万 Token 输出1$/百万 Token	-	-

厂商	模型	适用范围	计费明细	最大输出	上下文
OPEAI	PaddleOCR-VL-0.9B	默认档	输入0.6$/百万 Token 输出1.2$/百万 Token	-	-
OPEAI	Image-Recognition	默认档	输入1.35$/百万 Token 输出3.5$/百万 Token	-	-
Alibaba	Qwen3-VL-Flash qwen3-vl-flash	输入 Tokens <= 32K	输入0.05$/百万 Token 输出0.4$/百万 Token 缓存读取0.01$/百万 Token	-	-
		输入 Tokens <= 128K 且输入 Tokens > 32K	输入0.075$/百万 Token 输出0.6$/百万 Token 缓存读取0.015$/百万 Token
		输入 Tokens <= 256K 且输入 Tokens > 128K	输入0.12$/百万 Token 输出0.96$/百万 Token 缓存读取0.024$/百万 Token