The best LLMs for your use case:

1Qwen3.5 397B-A17BQwen

Qwen's native multimodal MoE model with 397B total parameters and 17B active, featuring hybrid Gated Delta Networks for strong reasoning and vision capabilities.

Speed:

Intelligence:

Price: (1M Tokens)

$0.60 / 3.60

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

Multilingual MMLU

Multilingual

88.5

MMLU-Pro

General Knowledge

87.8

MMMU

Multimodal - Vision

EQBench

Creative Writing

1275

LongBenchv2

Summarization

63.2

BFCL

Agents and Function Calling

72.9

SimpleQA

General Knowledge

54.3

GPQA-Diamond

General Knowledge

88.4

LMArena

Chat

1447

WebDevArena

Code

1189

LiveCodeBench

Code

83.6

Multilingual MMLU

Multilingual

88.5

MMLU-Pro

General Knowledge

87.8

MMMU

Multimodal - Vision

EQBench

Creative Writing

1275

LongBenchv2

Summarization

63.2

BFCL

Agents and Function Calling

72.9

SimpleQA

General Knowledge

54.3

GPQA-Diamond

General Knowledge

88.4

LMArena

Chat

1447

WebDevArena

Code

1189

LiveCodeBench

Code

83.6

Try it out

2GPT-OSS 120BOpenAI

OpenAI's open-source 120B parameter model with MXFP4 quantization for efficient inference.

Speed:

Intelligence:

Price: (1M Tokens)

$0.15 / 0.60

Inputs:

ImageText

JSON Mode:

Function Calling:

Benchmarks:

Multilingual MMLU

Multilingual

79.3

LMArena

Chat

1355

EQBench

Creative Writing

1152

WebDevArena

Code

1090

GPQA-Diamond

General Knowledge

73.1

SimpleQA

General Knowledge

16.8

Multilingual MMLU

Multilingual

79.3

LMArena

Chat

1355

EQBench

Creative Writing

1152

WebDevArena

Code

1090

GPQA-Diamond

General Knowledge

73.1

SimpleQA

General Knowledge

16.8

Try it out

Use case:

Multilingual

Features:

Function Calling