Legal

Contract Drafting & Redlining

Drafting, reviewing, and suggesting edits to legal contracts and agreements.

task.summarize_legal_contracttask.compare_docs_diff

Best for this use case

gpt-5-2025-08-07

Strong on LEXam Leaderboard average_score_pct and Vals Legal Bench overall_accuracy_pct

32.6%

Best benchmark score

39.6%

Confidence

All ranked models — top 3

🥇

gpt-5-2025-08-07

32.6%

🥈

gpt-5-mini-2025-08-07

31.8%

🥉

gemini-2.5-pro

30.8%

Ranked Models

Evidence Quality

94%

Evidence Points

Top Signal

LEXam Leaderboard: average_score_pct

Benchmark Sources

Last Updated

1d ago

Benchmark Sources (7)

LEXam Leaderboardaverage_score_pct · Apr 30, 2026

5% weight

Vals Case Law v2overall_accuracy_pct · Apr 30, 2026

4% weight

Vals Legal Benchoverall_accuracy_pct · Apr 30, 2026

4% weight

FACTS Benchmark Suitefacts_grounding_score_pct · Apr 30, 2026

3% weight

Vals CorpFin v2overall_accuracy_pct · Apr 30, 2026

1% weight

All Ranked Models

30 of 30 models

Rank	Model	Score	Confidence	Price / 1M	Evidence sources
🥇	gpt-5-2025-08-07 Strong on LEXam Leaderboard average_score_pct and Vals Legal Bench overall_accuracy_pct	32.6%	40%	—	LEXam Leaderboard·Apr 30, 2026Vals Legal Bench·Apr 30, 2026
🥈	gpt-5-mini-2025-08-07 Strong on LEXam Leaderboard average_score_pct and Vals Case Law v2 overall_accuracy_pct	31.8%	44%	—	LEXam Leaderboard·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
🥉	gemini-2.5-pro Strong on LEXam Leaderboard average_score_pct and FACTS Benchmark Suite facts_grounding_score_pct	30.8%	46%	—	LEXam Leaderboard·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#4	gemini-3.1-pro-preview Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	27.0%	32%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#5	gemini-3-pro-preview Strong on Vals Legal Bench overall_accuracy_pct and LEXam Leaderboard average_score_pct	25.6%	36%	—	Vals Legal Bench·Apr 30, 2026LEXam Leaderboard·Apr 30, 2026
#6	claude-sonnet-4 Strong on Vals Legal Bench overall_accuracy_pct and FACTS Benchmark Suite facts_grounding_score_pct	24.2%	33%	—	Vals Legal Bench·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#7	gpt-4.1-20250414 Strong on Vals Case Law v2 overall_accuracy_pct and Vals Legal Bench overall_accuracy_pct	23.7%	34%	—	Vals Case Law v2·Apr 30, 2026Vals Legal Bench·Apr 30, 2026
#8	gemini-3-flash-preview Strong on Vals Legal Bench overall_accuracy_pct and FACTS Benchmark Suite facts_grounding_score_pct	22.9%	31%	—	Vals Legal Bench·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#9	gpt-5.2-2025-12-11 Strong on FACTS Benchmark Suite facts_grounding_score_pct and Vals Legal Bench overall_accuracy_pct	22.8%	27%	—	FACTS Benchmark Suite·Apr 30, 2026Vals Legal Bench·Apr 30, 2026
#10	Grok-4-0709 Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	22.4%	31%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#11	claude-sonnet-4.6 Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	21.7%	28%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#12	gemini-3.1-flash-lite-preview Strong on Vals Legal Bench overall_accuracy_pct and FACTS Benchmark Suite facts_grounding_score_pct	21.6%	31%	—	Vals Legal Bench·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#13	gpt-5.4-2026-03-05 Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	20.2%	24%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#14	gemini-2.5-flash Strong on FACTS Benchmark Suite facts_grounding_score_pct and Galileo Agent Leaderboard v2 Avg TSQ	19.9%	27%	—	FACTS Benchmark Suite·Apr 30, 2026Galileo Agent Leaderboard v2·Apr 30, 2026
#15	grok-4-fast-reasoning Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	19.5%	31%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#16	gpt-5.1-2025-11-13 Strong on Vals Case Law v2 overall_accuracy_pct and Vals Legal Bench overall_accuracy_pct	19.5%	26%	—	Vals Case Law v2·Apr 30, 2026Vals Legal Bench·Apr 30, 2026
#17	grok-4-1-fast-reasoning Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	18.3%	26%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#18	claude-opus-4-5-20251101 Strong on Vals Legal Bench overall_accuracy_pct and FACTS Benchmark Suite facts_grounding_score_pct	18.1%	25%	—	Vals Legal Bench·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#19	deepseek-r1 Strong on LEXam Leaderboard average_score_pct and SYCON Bench (Table 2) sycon_unethical_tof_pct	17.2%	28%	—	LEXam Leaderboard·Apr 30, 2026SYCON Bench (Table 2)·Apr 30, 2026
#21	claude-opus-4.7 Strong on Vals Case Law v2 overall_accuracy_pct and Vals Finance Agent overall_accuracy_pct	16.5%	19%	—	Vals Case Law v2·Apr 30, 2026Vals Finance Agent·Apr 30, 2026
#24	claude-opus-4-6-thinking Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	15.6%	18%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#32	o3-20250416 Strong on Vals Legal Bench overall_accuracy_pct and Vals CorpFin v2 overall_accuracy_pct	13.9%	22%	—	Vals Legal Bench·Apr 30, 2026Vals CorpFin v2·Apr 30, 2026
#34	Kimi K2 Thinking Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	13.4%	21%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#36	grok-4-1-fast-non-reasoning Strong on Vals Legal Bench overall_accuracy_pct and Vals Finance Agent overall_accuracy_pct	13.1%	20%	—	Vals Legal Bench·Apr 30, 2026Vals Finance Agent·Apr 30, 2026
#38	claude-opus-4-1-20250805 Strong on Vals Legal Bench overall_accuracy_pct and FACTS Benchmark Suite facts_grounding_score_pct	13.0%	20%	—	Vals Legal Bench·Apr 30, 2026FACTS Benchmark Suite·Apr 30, 2026
#41	grok-4.20-0309-reasoning Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	12.4%	18%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#45	phi-4 Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	12.2%	20%	—	Open LLM Leaderboard GPQA·Apr 30, 2026Open LLM Leaderboard MMLU-Pro·Apr 30, 2026
#48	glm-4.7 Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	11.5%	18%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#50	minimax-m2.1 Strong on Vals Legal Bench overall_accuracy_pct and Vals Case Law v2 overall_accuracy_pct	11.1%	18%	—	Vals Legal Bench·Apr 30, 2026Vals Case Law v2·Apr 30, 2026
#53	kimi-k2.5-thinking Strong on Vals Case Law v2 overall_accuracy_pct and Vals CorpFin v2 overall_accuracy_pct	10.5%	17%	—	Vals Case Law v2·Apr 30, 2026Vals CorpFin v2·Apr 30, 2026