FrontierMath Benchmark Leaderboard

A benchmark of hundreds of original, exceptionally challenging mathematics problems crafted and vetted by expert mathematicians, covering most major branches of modern mathematics from number theory and real analysis to algebraic geometry and category theory.

Leaderboard

Top 13 models on FrontierMath Benchmark Leaderboard (scores from public evaluations).

1GPT-5.447.6% on FrontierMath Benchmark Leaderboard
2GPT-5.240.3% on FrontierMath Benchmark Leaderboard
3GPT-5.5 Pro39.6% on FrontierMath Benchmark Leaderboard
4GPT-5.535.4% on FrontierMath Benchmark Leaderboard
5GPT-5.126.7% on FrontierMath Benchmark Leaderboard
5GPT-5.1 Instant26.7% on FrontierMath Benchmark Leaderboard
5GPT-5.1 Thinking26.7% on FrontierMath Benchmark Leaderboard
8GPT-526.3% on FrontierMath Benchmark Leaderboard
9GPT-5 mini22.1% on FrontierMath Benchmark Leaderboard
10o315.8% on FrontierMath Benchmark Leaderboard
11GPT-5 nano9.6% on FrontierMath Benchmark Leaderboard
12o3-mini9.2% on FrontierMath Benchmark Leaderboard
13o15.5% on FrontierMath Benchmark Leaderboard

Rank	Model	Score	Lab
1	GPT-5.4	47.6%	—
2	GPT-5.2	40.3%	—
3	GPT-5.5 Pro	39.6%	—
4	GPT-5.5	35.4%	—
5	GPT-5.1	26.7%	—
5	GPT-5.1 Instant	26.7%	—
5	GPT-5.1 Thinking	26.7%	—
8	GPT-5	26.3%	—
9	GPT-5 mini	22.1%	—
10	o3	15.8%	—
11	GPT-5 nano	9.6%	—
12	o3-mini	9.2%	—
13	o1	5.5%	—

Models tracked

Models with frontiermath in their evaluation profile.

No models linked yet.

View task leaderboards →