Model Pricing

This page shows pricing structures and model limits across supported model types so you can compare integration cost and capabilities more easily. Please refer to the model marketplace as the source of truth, as documentation may lag behind.

Last Updated: 2026-06-02

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OpenAI	GPT-5.4 gpt-5.4	Input Tokens < 272K	Input2.5$/Million Tokens Output15$/Million Tokens Cache Read0.25$/Million Tokens	128K	1.05M
	GPT-5.4 gpt-5.4	Input Tokens >= 272K	Input5$/Million Tokens Output22.5$/Million Tokens Cache Read0.5$/Million Tokens	128K	1.05M
	GPT-5.4-Pro	Input Tokens < 272K	Input30$/Million Tokens Output180$/Million Tokens	128K	1.05M
	GPT-5.4-Pro	Input Tokens >= 272K	Input60$/Million Tokens Output270$/Million Tokens	128K	1.05M
	GPT-5.5 gpt-5.5	Input Tokens < 272K	Input5$/Million Tokens Output30$/Million Tokens Cache Read0.5$/Million Tokens	-	-
	GPT-5.5 gpt-5.5	Input Tokens >= 272K	Input10$/Million Tokens Output45$/Million Tokens Cache Read1$/Million Tokens	-	-
Anthropic	Claude-Sonnet-4.6 claude-sonnet-4.6	Default Tier	Input3$/Million Tokens Output15$/Million Tokens Cache Write (5m)3.75$/Million Tokens Cache Write (1h)6$/Million Tokens Cache Read0.3$/Million Tokens	200K	128K
	Claude-Opus-4.5 claude-opus-4.5	Default Tier	Input5$/Million Tokens Output25$/Million Tokens Cache Read0.5$/Million Tokens Cache Write (5m)6.25$/Million Tokens Cache Write (1h)10$/Million Tokens	200K	64K
	Claude-Sonnet-4.5 claude-sonnet-4.5	Input Tokens <= 200K	Input3$/Million Tokens Output15$/Million Tokens Cache Write (5m)3.75$/Million Tokens Cache Write (1h)6$/Million Tokens Cache Read0.3$/Million Tokens	64K	200K
	Claude-Sonnet-4.5 claude-sonnet-4.5	Input Tokens > 200K	Input6$/Million Tokens Output22.5$/Million Tokens Cache Write (5m)7.5$/Million Tokens Cache Write (1h)12$/Million Tokens Cache Read0.6$/Million Tokens	64K	200K
	Claude-Haiku-4.5 claude-haiku-4.5	Default Tier	Input1$/Million Tokens Output5$/Million Tokens Cache Write (5m)1.25$/Million Tokens Cache Write (1h)2$/Million Tokens Cache Read0.1$/Million Tokens	-	-
Google	Gemini-3.1-Pro gemini-3.1-pro	Input Tokens <= 200K	Input2$/Million Tokens Output12$/Million Tokens Cache Read0.2$/Million Tokens	64K	1M
	Gemini-3.1-Pro gemini-3.1-pro	Input Tokens > 200K	Input4$/Million Tokens Output18$/Million Tokens Cache Read0.4$/Million Tokens	64K	1M
	Gemini-3-Flash gemini-3-flash	Default Tier	Input0.5$/Million Tokens Output3$/Million Tokens Cache Read0.05$/Million Tokens	64K	1M
DeepSeek	DeepSeek-V3.2	Default Tier	Input0.3$/Million Tokens Output0.5$/Million Tokens	32K	128K
	DeepSeek-V3.2-Thinking	Default Tier	Input0.3$/Million Tokens Output0.5$/Million Tokens	32K	128K
	DeepSeek-R1	Default Tier	Input0.6$/Million Tokens Output2.4$/Million Tokens	28K	128K
	DeepSeek-V4-Flash deepseek-v4-flash	Default Tier	Input0.18$/Million Tokens Output0.32$/Million Tokens Cache Read0.0036$/Million Tokens	-	-
	DeepSeek-V4-Pro deepseek-v4-pro	Default Tier	Input2$/Million Tokens Output3.8$/Million Tokens Cache Read0.02$/Million Tokens	-	-
Alibaba	Qwen3-32B qwen3-32b	Default Tier	Input0.284$/Million Tokens Output1.136$/Million Tokens	32K	32K
	Qwen3-32B-Thinking qwen3-32b-thinking	Default Tier	Input0.284$/Million Tokens Output2.84$/Million Tokens	32K	32K
	Qwen3-coder-plus qwen3-coder-plus	Input Tokens <= 32K	Input0.574$/Million Tokens Output2.294$/Million Tokens Cache Read0.115$/Million Tokens	63K	1M
		Input Tokens <= 128K and Input Tokens > 32K	Input0.861$/Million Tokens Output3.441$/Million Tokens Cache Read0.173$/Million Tokens
		Input Tokens <= 256K and Input Tokens > 128K	Input1.434$/Million Tokens Output5.735$/Million Tokens Cache Read0.287$/Million Tokens
		Input Tokens > 256K	Input2.868$/Million Tokens Output28.671$/Million Tokens Cache Read0.574$/Million Tokens
	Qwen3-8B qwen3-8b	Default Tier	Input0.18$/Million Tokens Output0.7$/Million Tokens	-	-
MiniMax	MiniMax-M2.5	Default Tier	Input0.304$/Million Tokens Output1.213$/Million Tokens Cache Read0.061$/Million Tokens	-	-
Moonshot	Kimi-K2.5	Default Tier	Input0.574$/Million Tokens Output3.011$/Million Tokens Cache Read0.115$/Million Tokens	32K	256K
xAI	Grok-3	Default Tier	Input3$/Million Tokens Output15$/Million Tokens	-	131K
Zhipu	GLM-5	Input Tokens <= 32K	Input0.573$/Million Tokens Output2.58$/Million Tokens Cache Read0.115$/Million Tokens	128K	200K
Zhipu	GLM-5	Input Tokens > 32K	Input0.86$/Million Tokens Output3.154$/Million Tokens Cache Read0.172$/Million Tokens	128K	200K
ByteDance	bytedance-seed-2.0-lite	Input Tokens < 128K	Input0.25$/Million Tokens Output2$/Million Tokens Cache Read0.05$/Million Tokens	128K	256K
ByteDance	bytedance-seed-2.0-lite	Input Tokens > 128K	Input0.5$/Million Tokens Output4$/Million Tokens Cache Read0.1$/Million Tokens	128K	256K
OPEAI	gemma-4	Default Tier	Input0.85$/Million Tokens Output0.85$/Million Tokens	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OpenAI	GPT-5.3-Codex gpt-5.3-codex	Input Tokens < 272K	Input1.75$/Million Tokens Output14$/Million Tokens Cache Read0.175$/Million Tokens	128K	400K
Anthropic	Claude-Opus-4.6 claude-opus-4.6	Default Tier	Input5$/Million Tokens Output25$/Million Tokens Cache Write (5m)6.25$/Million Tokens Cache Write (1h)10$/Million Tokens Cache Read0.5$/Million Tokens	128K	200K
Anthropic	Claude-Opus-4.7 claude-opus-4.7	Default Tier	Input5$/Million Tokens Output25$/Million Tokens Cache Write (5m)6.25$/Million Tokens Cache Write (1h)10$/Million Tokens Cache Read0.5$/Million Tokens	-	-
Alibaba	Qwen3-Coder-Next qwen3-coder-next	Input Tokens <= 32K	Input0.3$/Million Tokens Output1.5$/Million Tokens	-	-
		Input Tokens <= 128K and Input Tokens > 32K	Input0.5$/Million Tokens Output2.5$/Million Tokens
		Input Tokens <= 256K and Input Tokens > 128K	Input0.8$/Million Tokens Output4$/Million Tokens

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
Alibaba	Qwen-Image	Default Tier	Image1$/image	-	-
	Qwen-Image-2.0 qwen-image-2.0	Default Tier	Image0.035$/image	-	-
	wan2.6-image	Default Tier	Image0.03$/image	-	-
	wan2.6-t2i	Default Tier	Image0.03$/image	-	-
ByteDance	Doubao-Seedream-4.5	Default Tier	Image0.05$/image	-	-
	Doubao-Seedream-3.0	Default Tier	Image0.03$/image	-	-
	bytedance-seedream-5.0	Default Tier	Image0.035$/image	-	-
Google	Nano Banana 2	Default Tier	Image0.16$/image	-	-
OpenAI	GPT-Image-2 gpt-image-2	Default Tier	Text Input5$/Million Tokens Image Input8$/Million Tokens Output30$/Million Tokens	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
ByteDance	bytedance-seedance-1.5	Default Tier	Video (Audio)2.4$/Million Tokens Video (Silent)1.2$/Million Tokens	-	-
	seedance-2-0-nsfw	Video Resolution <= 720	Output (No Video Input)7.72$/Million Tokens Output (Video Input)4.75$/Million Tokens	-	-
	seedance-2-0-nsfw	Video Resolution <= 1.08K and Video Resolution > 720	Output (No Video Input)8.49$/Million Tokens Output (Video Input)5.19$/Million Tokens	-	-
OpenAI	sora-2	Default Tier	Video0.1$/second	-	-
Kling	kling-v3	Default Tier	Video (Audio)0.133$/second Video (Silent)0.089$/second	-	-
Alibaba	wan2.6-i2v	Default Tier	Video0.15$/second	-	-
Alibaba	wan2.7-i2v	Default Tier	Video0.15$/second	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OPEAI	AudioLLM/Spark	Default Tier	Input1.6$/Million Tokens Output1.6$/Million Tokens	-	-
OPEAI	AudioLLM/Voice1.0	Default Tier	Input1.8$/Million Tokens Output3.6$/Million Tokens	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OPEAI	AudioLLM/Voice2.0	Default Tier	Input1.5$/Million Tokens Output3$/Million Tokens	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OPEAI	MLModel1.5	Default Tier	Input1$/Million Tokens Output2$/Million Tokens	-	-
	MTModel1.0	Default Tier	Input1.4$/Million Tokens Output1.4$/Million Tokens	-	-
	translate-2.0	Input Tokens < 272K	Input2.5$/Million Tokens Output15$/Million Tokens Cache Read0.25$/Million Tokens	-	-
	translate-2.0	Input Tokens >= 272K	Input5$/Million Tokens Output22.5$/Million Tokens Cache Read0.5$/Million Tokens	-	-
	translate-fast-2.0	Default Tier	Input1$/Million Tokens Output5$/Million Tokens Cache Write (5m)1.25$/Million Tokens Cache Write (1h)2$/Million Tokens Cache Read0.1$/Million Tokens	-	-
Tencent	Tencent/MT-Hunyuan-7B	Default Tier	Input1$/Million Tokens Output1$/Million Tokens	-	-
Tencent	hy-mt2	Default Tier	Input0.5$/Million Tokens Output1$/Million Tokens	-	-

Vendor	Model	Tier	Pricing Details	Max Output	Context Window
OPEAI	PaddleOCR-VL-0.9B	Default Tier	Input0.6$/Million Tokens Output1.2$/Million Tokens	-	-
OPEAI	Image-Recognition	Default Tier	Input1.35$/Million Tokens Output3.5$/Million Tokens	-	-
Alibaba	Qwen3-VL-Flash qwen3-vl-flash	Input Tokens <= 32K	Input0.05$/Million Tokens Output0.4$/Million Tokens Cache Read0.01$/Million Tokens	-	-
		Input Tokens <= 128K and Input Tokens > 32K	Input0.075$/Million Tokens Output0.6$/Million Tokens Cache Read0.015$/Million Tokens
		Input Tokens <= 256K and Input Tokens > 128K	Input0.12$/Million Tokens Output0.96$/Million Tokens Cache Read0.024$/Million Tokens