模型价格
本页用于展示不同类型模型的计费方式与限制,方便你在接入与成本评估时快速对照。请以模型市场为准,文档具有滞后性。
- 文本对话
- 图像生成
- 视频生成
- TTS
- 实时语音
- 翻译
- 图片识别
- 向量
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OpenAI | GPT-5.4 gpt-5.4 | 输入 Tokens < 272K | 输入2.5$/百万 Token 输出15$/百万 Token 缓存读取0.25$/百万 Token | 128K | 1.05M |
| 输入 Tokens >= 272K | 输入5$/百万 Token 输出22.5$/百万 Token 缓存读取0.5$/百万 Token | ||||
GPT-5.3-Codex gpt-5.3-codex | 默认档 | 输入1.75$/百万 Token 输出14$/百万 Token 缓存读取0.175$/百万 Token | 128K | 400K | |
GPT-5.4-Pro | 输入 Tokens < 272K | 输入30$/百万 Token 输出180$/百万 Token | 128K | 1.05M | |
| 输入 Tokens >= 272K | 输入60$/百万 Token 输出270$/百万 Token | ||||
| Anthropic | Claude-Opus-4.6 claude-opus-4.6 | 默认档 | 输入5$/百万 Token 输出25$/百万 Token 缓存写入 (5m)6.25$/百万 Token 缓存写入 (1h)10$/百万 Token 缓存读取0.5$/百万 Token | 128K | 200K |
Claude-Sonnet-4.6 claude-sonnet-4.6 | 默认档 | 输入3$/百万 Token 输出15$/百万 Token 缓存写入 (5m)3.75$/百万 Token 缓存写入 (1h)6$/百万 Token 缓存读取0.3$/百万 Token | 200K | 128K | |
Claude-Opus-4.5 claude-opus-4.5 | 默认档 | 输入5$/百万 Token 输出25$/百万 Token 缓存读取0.5$/百万 Token 缓存写入 (5m)6.25$/百万 Token 缓存写入 (1h)10$/百万 Token | 200K | 64K | |
Claude-Sonnet-4.5 claude-sonnet-4.5 | 输入 Tokens <= 200K | 输入3$/百万 Token 输出15$/百万 Token 缓存写入 (5m)3.75$/百万 Token 缓存写入 (1h)6$/百万 Token 缓存读取0.3$/百万 Token | 64K | 200K | |
| 输入 Tokens > 200K | 输入201$/百万 Token 输出22.5$/百万 Token 缓存写入 (5m)7.5$/百万 Token 缓存写入 (1h)12$/百万 Token 缓存读取0.6$/百万 Token | ||||
Claude-Haiku-4.5 claude-haiku-4.5 | 默认档 | 输入1$/百万 Token 输出5$/百万 Token 缓存写入 (5m)1.25$/百万 Token 缓存写 入 (1h)2$/百万 Token 缓存读取0.1$/百万 Token | - | - | |
Gemini-3.1-Pro gemini-3.1-pro | 输入 Tokens <= 200K | 输入2$/百万 Token 输出12$/百万 Token 缓存读取0.2$/百万 Token | 64K | 1M | |
| 输入 Tokens > 200K | 输入4$/百万 Token 输出18$/百万 Token 缓存读取0.4$/百万 Token | ||||
Gemini-3-Flash gemini-3-flash | 默认档 | 输入0.5$/百万 Token 输出3$/百万 Token 缓存读取0.05$/百万 Token | 64K | 1M | |
| DeepSeek | DeepSeek-V3.2 | 默认档 | 输入0.3$/百万 Token 输出0.5$/百万 Token | 32K | 128K |
DeepSeek-V3.2-Thinking | 默认档 | 输入0.3$/百万 Token 输出0.5$/百万 Token | 32K | 128K | |
DeepSeek-R1 | 默认档 | 输入0.6$/百万 Token 输出2.4$/百万 Token | 28K | 128K | |
| Alibaba | Qwen3-32B qwen3-32b | 默认档 | 输入0.284$/百万 Token 输出1.136$/百万 Token | 32K | 32K |
Qwen3-32B-Thinking qwen3-32b-thinking | 默认档 | 输入0.284$/百万 Token 输出2.84$/百万 Token | 32K | 32K | |
Qwen3-coder-plus | 输入 Tokens <= 32K | 输入0.574$/百万 Token 输出2.294$/百万 Token 缓存读取0.115$/百万 Token | 63K | 1M | |
| 输入 Tokens <= 128K 且 输入 Tokens > 32K | 输入0.861$/百万 Token 输出3.441$/百万 Token 缓存读取0.173$/百万 Token | ||||
| 输入 Tokens <= 256K 且 输入 Tokens > 128K | 输入1.434$/百万 Token 输出5.735$/百万 Token 缓存读取0.287$/百万 Token | ||||
| 输入 Tokens > 256K | 输入2.868$/百万 Token 输出28.671$/百万 Token 缓存读取0.574$/百万 Token | ||||
| MiniMax | MiniMax-M2.5 | 默认档 | 输入0.304$/百万 Token 输出1.213$/百万 Token 缓存读取0.061$/百万 Token | - | - |
| Moonshot | Kimi-K2.5 | 默认档 | 输入0.574$/百万 Token 输出3.011$/百万 Token 缓存读取0.115$/百万 Token | 32K | 256K |
| xAI | Grok-3 | 默认档 | 输入3$/百万 Token 输出15$/百万 Token | - | 131K |
| Zhipu | GLM-5 | 输入 Tokens <= 32K | 输入0.573$/百万 Token 输出2.58$/百万 Token 缓存读取0.115$/百万 Token | 128K | 200K |
| 输入 Tokens > 32K | 输入0.86$/百万 Token 输出3.154$/百万 Token 缓存读取0.172$/百万 Token | ||||
| ByteDance | bytedance-seed-2.0-lite | 输入 Tokens < 128K | 输入0.25$/百万 Token 输出2$/百万 Token 缓存读取0.05$/百万 Token | 128K | 256K |
| 输入 Tokens > 128K | 输入0.5$/百万 Token 输出4$/百万 Token 缓存读取0.1$/百万 Token | ||||
| OPEAI | gemma-4 | 默认档 | 输入0.85$/百万 Token 输出0.85$/百万 Token | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| Alibaba | Qwen-Image | 默认档 | 图片1$/张 | - | - |
wan2.6-image | 默认档 | 图片0.03$/张 | - | - | |
wan2.6-t2i | 默认档 | 图片0.03$/张 | - | - | |
| ByteDance | Doubao-Seedream-4.5 | 默认档 | 图片0.05$/张 | - | - |
Doubao-Seedream-3.0 | 默认档 | 图片0.03$/张 | - | - | |
bytedance-seedream-5.0 | 默认档 | 图片0.035$/张 | - | - | |
Nano Banana 2 | 默认档 | 图片0.16$/张 | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| ByteDance | bytedance-seedance-1.5 | 默认档 | 视频 (有声)2.4$/百万 Token 视频 (静音)1.2$/百万 Token | - | - |
| OpenAI | sora-2 | 默认档 | 视频0.1$/秒 | - | - |
| Alibaba | wan2.6-i2v | 默认档 | 视频0.15$/秒 | - | - |
wan2.7-i2v | 默认档 | 视频0.15$/秒 | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OPEAI | AudioLLM/Spark | 默认档 | 输入1.6$/百万 Token 输出1.6$/百万 Token | - | - |
AudioLLM/Voice1.0 | 默认档 | 输入1.8$/百万 Token 输出3.6$/百万 Token | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OPEAI | AudioLLM/Voice2.0 | 默认档 | 输入1.5$/百万 Token 输出3$/百万 Token | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OPEAI | MLModel1.5 | 默认档 | 输入1$/百万 Token 输出2$/百万 Token | - | - |
MTModel1.0 | 默认档 | 输入1.4$/百万 Token 输出1.4$/百万 Token | - | - | |
Tencent/MT-Hunyuan-7B | 默认档 | 输入1$/百万 Token 输出1$/百万 Token | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OPEAI | PaddleOCR-VL-0.9B | 默认档 | 输入0.6$/百万 Token 输出1.2$/百万 Token | - | - |
Image-Recognition | 默认档 | 输入1.35$/百万 Token 输出3.5$/百万 Token | - | - |
| 厂商 | 模型 | 适用范围 | 计费明细 | 最大输出 | 上下文 |
|---|---|---|---|---|---|
| OPEAI | bge-m3 | 默认档 | 输入0.1$/百万 Token 输出0.1$/百万 Token | - | - |