Leaderboard

Explore how AI models perform across our five core evaluation categories. Rankings are based on real-world conversations and human evaluations, measuring what truly matters in an AI assistant.

	Model
#1	GPT-5.6 SolNew gpt-5.6-sol	95.50	99.5	94.0	99.5	85.0	99.5	72.0	$5.00 / $30.00	1.1M	128K
#2	Claude Opus 4.7 claude-opus-4-7	95.30	94.5	93.5	96.5	94.5	97.5	65.0	$5.00 / $25.00	200K	8.2K
#3	Claude Fable 5 claude-fable-5	94.40	93.5	95.0	93.0	96.5	94.0	48.0	$10.00 / $50.00	1M	128K
#4	Claude Opus 4.8 claude-opus-4-8	94.16	95.5	94.5	97.0	86.0	97.8	68.0	$5.00 / $25.00	1M	128K
#5	Claude Opus 4.6 claude-opus-4-6	93.18	93.5	92.5	92.0	92.3	95.5	45.0	$5.00 / $25.00	200K	128K
#6	Gemini 3.1 Pro gemini-3.1-pro-preview	91.72	92.5	92.0	89.1	89.0	96.0	85.0	$2.00 / $12.00	1M	65.5K
#7	Claude Opus 4.5 claude-opus-4-5-202511...	91.45	89.5	90.0	95.3	88.6	93.8	60.0	$5.00 / $25.00	200K	64K
#8	GPT-5.6 TerraNew gpt-5.6-terra	90.90	96.5	88.5	97.0	75.0	97.5	84.0	$2.50 / $15.00	1.1M	128K
#9	Claude Sonnet 4.6 claude-sonnet-4-6	90.62	90.5	88.0	92.5	89.1	93.0	80.0	$3.00 / $15.00	200K	8.2K
#10	GLM 5.2 glm-5.2	90.60	93.5	86.0	93.0	87.0	93.5	58.0	$1.40 / $4.40	1M	131.1K
#11	Kimi K3New kimi-k3	90.60	95.5	84.0	95.0	82.0	96.5	58.0	$3.00 / $15.00	1.0M	1.0M
#12	Grok 4.5New grok-4.5	90.50	94.0	89.5	93.5	81.0	94.5	86.0	$2.00 / $6.00	500K	128K
#13	GLM 5.1 glm-5.1	90.30	91.0	88.5	90.0	90.5	91.5	70.0	$1.30 / $4.30	205K	120K
#14	Gemini 3 Pro gemini-3-pro-preview	90.15	92.2	86.5	89.2	88.7	94.3	60.0	$2.00 / $12.00	2M	65.5K
#15	GLM 5.2 Fast glm-5.2-fast	90.10	93.0	85.5	92.5	86.5	93.0	88.0	$2.10 / $6.60	1M	131.1K
#16	Grok 4.3 grok-4.3	90.00	91.5	88.5	90.5	87.0	92.5	82.0	$1.25 / $2.50	1M	128K
#17	GPT-5.5 gpt-5.5	89.90	95.5	87.5	96.5	73.0	97.0	72.0	$5.00 / $30.00	1.1M	128K
#18	Claude Sonnet 4.5 claude-sonnet-4-5	89.66	91.5	85.8	89.2	89.5	92.3	68.5	$3.00 / $15.00	200K	64K
#19	GPT 5.1 gpt-5.1	89.34	92.5	87.5	90.1	82.1	94.5	80.0	$1.25 / $10.00	400K	128K
#20	GPT-5.5 Pro gpt-5.5-pro	89.30	96.5	86.0	97.5	68.0	98.5	48.0	$30.00 / $180.00	1.1M	128K
#21	o3 o3-2025-04-16	89.16	89.5	85.3	88.5	88.5	94.0	58.0	$2.00 / $8.00	200K	100K
#22	GPT 5.2 gpt-5.2	89.08	93.5	86.7	87.3	82.5	95.3	75.0	$1.75 / $14.00	400K	128K
#23	GPT-5.4 Pro gpt-5.4-pro	89.00	94.5	87.0	94.5	74.0	95.0	52.0	$30.00 / $180.00	1.1M	128K
#24	GPT-5.4 gpt-5.4	88.88	92.7	90.0	91.3	80.0	90.5	82.2	$2.50 / $15.00	1.1M	128K
#25	GPT-5.6 LunaNew gpt-5.6-luna	88.40	94.0	85.5	94.5	73.0	95.0	94.0	$1.00 / $6.00	1.1M	128K

Showing 25 of 69 models