The best LLMs for your use case:

1Qwen3.5 397B-A17BQwen

Qwen's native multimodal MoE model with 397B total parameters and 17B active, featuring hybrid Gated Delta Networks for strong reasoning and vision capabilities.

Speed:

Intelligence:

Price: (1M Tokens)

$0.60 / 3.60

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

MMMU

Multimodal - Vision

GPQA-Diamond

General Knowledge

88.4

MMLU-Pro

General Knowledge

87.8

LongBenchv2

Summarization

63.2

Multilingual MMLU

Multilingual

88.5

BFCL

Agents and Function Calling

72.9

LMArena

Chat

1447

LiveCodeBench

Code

83.6

MMMU

Multimodal - Vision

GPQA-Diamond

General Knowledge

88.4

MMLU-Pro

General Knowledge

87.8

LongBenchv2

Summarization

63.2

Multilingual MMLU

Multilingual

88.5

BFCL

Agents and Function Calling

72.9

LMArena

Chat

1447

LiveCodeBench

Code

83.6

Try it out

2Kimi K2.5Moonshot

1T-parameter MoE reasoning model with state-of-the-art performance on math, code, and multimodal tasks.

Speed:

Intelligence:

Price: (1M Tokens)

$0.50 / 2.80

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

MMMU

Multimodal - Vision

84.3

LiveCodeBench

Code

GPQA-Diamond

General Knowledge

87.6

MMLU-Pro

General Knowledge

87.1

LMArena

Chat

1447

WebDevArena

Code

1446

LongBenchv2

Summarization

SimpleQA

General Knowledge

36.9

MMMU

Multimodal - Vision

84.3

LiveCodeBench

Code

GPQA-Diamond

General Knowledge

87.6

MMLU-Pro

General Knowledge

87.1

LMArena

Chat

1447

WebDevArena

Code

1446

LongBenchv2

Summarization

SimpleQA

General Knowledge

36.9

Try it out

Use case:

Multimodal - Vision