跳到主要内容

模型价格

本页用于展示不同类型模型的计费方式与限制,方便你在接入与成本评估时快速对照。请以模型市场为准,文档具有滞后性。

更新时间: 2026-04-16
厂商模型适用范围计费明细最大输出上下文
OpenAI
GPT-5.4
gpt-5.4
输入 Tokens < 272K
输入2.5$/百万 Token
输出15$/百万 Token
缓存读取0.25$/百万 Token
128K1.05M
输入 Tokens >= 272K
输入5$/百万 Token
输出22.5$/百万 Token
缓存读取0.5$/百万 Token
GPT-5.3-Codex
gpt-5.3-codex
默认档
输入1.75$/百万 Token
输出14$/百万 Token
缓存读取0.175$/百万 Token
128K400K
GPT-5.4-Pro
输入 Tokens < 272K
输入30$/百万 Token
输出180$/百万 Token
128K1.05M
输入 Tokens >= 272K
输入60$/百万 Token
输出270$/百万 Token
Anthropic
Claude-Opus-4.6
claude-opus-4.6
默认档
输入5$/百万 Token
输出25$/百万 Token
缓存写入 (5m)6.25$/百万 Token
缓存写入 (1h)10$/百万 Token
缓存读取0.5$/百万 Token
128K200K
Claude-Sonnet-4.6
claude-sonnet-4.6
默认档
输入3$/百万 Token
输出15$/百万 Token
缓存写入 (5m)3.75$/百万 Token
缓存写入 (1h)6$/百万 Token
缓存读取0.3$/百万 Token
200K128K
Claude-Opus-4.5
claude-opus-4.5
默认档
输入5$/百万 Token
输出25$/百万 Token
缓存读取0.5$/百万 Token
缓存写入 (5m)6.25$/百万 Token
缓存写入 (1h)10$/百万 Token
200K64K
Claude-Sonnet-4.5
claude-sonnet-4.5
输入 Tokens <= 200K
输入3$/百万 Token
输出15$/百万 Token
缓存写入 (5m)3.75$/百万 Token
缓存写入 (1h)6$/百万 Token
缓存读取0.3$/百万 Token
64K200K
输入 Tokens > 200K
输入201$/百万 Token
输出22.5$/百万 Token
缓存写入 (5m)7.5$/百万 Token
缓存写入 (1h)12$/百万 Token
缓存读取0.6$/百万 Token
Claude-Haiku-4.5
claude-haiku-4.5
默认档
输入1$/百万 Token
输出5$/百万 Token
缓存写入 (5m)1.25$/百万 Token
缓存写入 (1h)2$/百万 Token
缓存读取0.1$/百万 Token
--
Google
Gemini-3.1-Pro
gemini-3.1-pro
输入 Tokens <= 200K
输入2$/百万 Token
输出12$/百万 Token
缓存读取0.2$/百万 Token
64K1M
输入 Tokens > 200K
输入4$/百万 Token
输出18$/百万 Token
缓存读取0.4$/百万 Token
Gemini-3-Flash
gemini-3-flash
默认档
输入0.5$/百万 Token
输出3$/百万 Token
缓存读取0.05$/百万 Token
64K1M
DeepSeek
DeepSeek-V3.2
默认档
输入0.3$/百万 Token
输出0.5$/百万 Token
32K128K
DeepSeek-V3.2-Thinking
默认档
输入0.3$/百万 Token
输出0.5$/百万 Token
32K128K
DeepSeek-R1
默认档
输入0.6$/百万 Token
输出2.4$/百万 Token
28K128K
Alibaba
Qwen3-32B
qwen3-32b
默认档
输入0.284$/百万 Token
输出1.136$/百万 Token
32K32K
Qwen3-32B-Thinking
qwen3-32b-thinking
默认档
输入0.284$/百万 Token
输出2.84$/百万 Token
32K32K
Qwen3-coder-plus
输入 Tokens <= 32K
输入0.574$/百万 Token
输出2.294$/百万 Token
缓存读取0.115$/百万 Token
63K1M
输入 Tokens <= 128K 且 输入 Tokens > 32K
输入0.861$/百万 Token
输出3.441$/百万 Token
缓存读取0.173$/百万 Token
输入 Tokens <= 256K 且 输入 Tokens > 128K
输入1.434$/百万 Token
输出5.735$/百万 Token
缓存读取0.287$/百万 Token
输入 Tokens > 256K
输入2.868$/百万 Token
输出28.671$/百万 Token
缓存读取0.574$/百万 Token
MiniMax
MiniMax-M2.5
默认档
输入0.304$/百万 Token
输出1.213$/百万 Token
缓存读取0.061$/百万 Token
--
Moonshot
Kimi-K2.5
默认档
输入0.574$/百万 Token
输出3.011$/百万 Token
缓存读取0.115$/百万 Token
32K256K
xAI
Grok-3
默认档
输入3$/百万 Token
输出15$/百万 Token
-131K
Zhipu
GLM-5
输入 Tokens <= 32K
输入0.573$/百万 Token
输出2.58$/百万 Token
缓存读取0.115$/百万 Token
128K200K
输入 Tokens > 32K
输入0.86$/百万 Token
输出3.154$/百万 Token
缓存读取0.172$/百万 Token
ByteDance
bytedance-seed-2.0-lite
输入 Tokens < 128K
输入0.25$/百万 Token
输出2$/百万 Token
缓存读取0.05$/百万 Token
128K256K
输入 Tokens > 128K
输入0.5$/百万 Token
输出4$/百万 Token
缓存读取0.1$/百万 Token
OPEAI
gemma-4
默认档
输入0.85$/百万 Token
输出0.85$/百万 Token
--