The best LLMs for your use case:

1Qwen3 235B A22BQwen

Hybrid instruct + reasoning model (232Bx22B MoE) optimized for high-throughput, cost-efficient inference and distillation.

Speed:

Intelligence:

Price: (1M Tokens)

$0.20

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

BFCL

Agents and Function Calling

70.8

LiveBench

General Knowledge

73.23

EQBench

Creative Writing

1271.6

LiveCodeBench

Code

80.4

MGSM

Multilingual

92.7

GPQA-Diamond

General Knowledge

MMLU-Pro

General Knowledge

83.66

Aider Polyglot

Code

59.6

LongBenchv2

Summarization

50.1

Multilingual MMLU

Multilingual

82.8

WebDevArena

Code

1186

#11

LMArena

Chat

45.92

BFCL

Agents and Function Calling

70.8

LiveBench

General Knowledge

73.23

EQBench

Creative Writing

1271.6

LiveCodeBench

Code

80.4

MGSM

Multilingual

92.7

GPQA-Diamond

General Knowledge

MMLU-Pro

General Knowledge

83.66

Aider Polyglot

Code

59.6

LongBenchv2

Summarization

50.1

Multilingual MMLU

Multilingual

82.8

WebDevArena

Code

1186

#11

LMArena

Chat

45.92

Try it out

2Qwen 2.5 72B Instruct TurboQwen

Decoder-only model built for advanced language processing tasks.

Speed:

Intelligence:

Price: (1M Tokens)

$1.20

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

BFCL

Agents and Function Calling

63.37

MMLU-Pro

General Knowledge

71.1

EQBench

Creative Writing

701.3

LiveCodeBench

Code

55.5

LongBenchv2

Summarization

43.5

Multilingual MMLU

Multilingual

69.05

LiveBench

General Knowledge

52.3

MGSM

Multilingual

89.5

LMArena

Chat

1257

BFCL

Agents and Function Calling

63.37

MMLU-Pro

General Knowledge

71.1

EQBench

Creative Writing

701.3

LiveCodeBench

Code

55.5

LongBenchv2

Summarization

43.5

Multilingual MMLU

Multilingual

69.05

LiveBench

General Knowledge

52.3

MGSM

Multilingual

89.5

LMArena

Chat

1257

Try it out

Use case:

Agents and Function Calling