marketing_sales

Best Model for Ad Copy Generation

Ranked models for generating diverse headline and CTA variants under strict constraints.

#1 Recommendation

qwen-2.5-72b-instruct

Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa

external/qwen/qwen-2-5-72b-instruct

29.1%

Score

45.3%

Confidence

Evidence

Runners-up:#2 anthropic/claude-sonnet-4 (23.7%)#3 Grok-4-0709 (23.6%)#4 gemini-2.5-pro (23.0%)

Ranked Models

Evidence Quality

97%

Evidence Points

Top Signal

Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct

Benchmark Sources

Last Updated

11h ago

All Ranked Models

30 of 30 models

Rank	Model	Score	Confidence	Price / 1M	Evidence sources
🥇	qwen-2.5-72b-instruct Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	29.1%	45%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
🥈	claude-sonnet-4 Strong on Galileo Agent Leaderboard v2 Avg TSQ and EQ-Bench Leaderboard eq_bench_score	23.7%	31%	$6.00	Galileo Agent Leaderboard v2·Apr 29, 2026EQ-Bench Leaderboard·Apr 29, 2026
🥉	Grok-4-0709 Strong on Galileo Agent Leaderboard v2 Avg TSQ and EQ-Bench Leaderboard eq_bench_score	23.6%	31%	—	Galileo Agent Leaderboard v2·Apr 29, 2026EQ-Bench Leaderboard·Apr 29, 2026
#4	gemini-2.5-pro Strong on EQ-Bench Leaderboard eq_bench_score and Galileo Agent Leaderboard v2 Avg TSQ	23.0%	32%	$3.44	EQ-Bench Leaderboard·Apr 29, 2026Galileo Agent Leaderboard v2·Apr 29, 2026
#5	Mistral-Large-Instruct-2411 Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	21.9%	29%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#6	gpt-5-2025-08-07 Strong on EQ-Bench Leaderboard eq_bench_score and UGI Leaderboard Writing ✍️	21.2%	26%	—	EQ-Bench Leaderboard·Apr 29, 2026UGI Leaderboard·Apr 29, 2026
#7	Mixtral-8x22B-Instruct-v0.1 Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	20.6%	35%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#8	gemma-2-27b-it Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	20.0%	32%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#9	Steelskull/L3.3-MS-Nevoria-70b Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	19.8%	24%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#10	o3-20250416 Strong on EQ-Bench Leaderboard eq_bench_score and UGI Leaderboard Writing ✍️	19.3%	24%	$3.50	EQ-Bench Leaderboard·Apr 29, 2026UGI Leaderboard·Apr 29, 2026
#11	gpt-4o Strong on CRMArena Function Calling overall_score_pct and EQ-Bench Leaderboard eq_bench_score	19.2%	25%	$0.26	CRMArena Function Calling·Apr 29, 2026EQ-Bench Leaderboard·Apr 29, 2026
#12	Qwen2-72B-Instruct Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	19.1%	28%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#13	Sao10K/70B-L3.3-Cirrus-x1 Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	18.7%	24%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#14	RYS-XLarge Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	18.7%	26%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#15	RYS-XLarge-base Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	18.5%	26%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#16	MaziyarPanahi/calme-3.2-instruct-78b Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	18.4%	22%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#17	Steelskull/L3.3-Nevoria-R1-70b Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	18.3%	22%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#18	Qwen2.5-32B-Instruct Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	18.3%	29%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#19	phi-4 Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	18.1%	28%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#20	gpt-4.1-20250414 Strong on Galileo Agent Leaderboard v2 Avg TSQ and Galileo Agent Leaderboard v2 Avg AC	18.0%	25%	—	Galileo Agent Leaderboard v2·Apr 29, 2026Galileo Agent Leaderboard v2·Apr 29, 2026
#21	MaziyarPanahi/calme-2.4-rys-78b Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	17.9%	22%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#22	MaziyarPanahi/calme-3.1-instruct-78b Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	17.9%	22%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#23	wizardlm-2-8x22b Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	17.9%	29%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#24	Tarek07/Progenitor-V1.1-LLaMa-70B Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	17.8%	22%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#25	CalmeRys-78B-Orpo-v0.1 Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	17.8%	22%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#26	solar-pro-preview-instruct Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	17.5%	26%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#27	Apollo-70B Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	17.3%	22%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#28	Triangle104/Set-70b Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	17.3%	22%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026
#29	Homer-v1.0-Qwen2.5-72B Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa	17.1%	22%	—	Open LLM Leaderboard MMLU-Pro·Apr 29, 2026Open LLM Leaderboard GPQA·Apr 29, 2026
#30	Tarek07/Thalassic-Alpha-LLaMa-70B Strong on Open LLM Leaderboard GPQA gpqa and Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct	17.1%	22%	—	Open LLM Leaderboard GPQA·Apr 29, 2026Open LLM Leaderboard MMLU-Pro·Apr 29, 2026

Head-to-Head: #1 vs #2

Top Pick

qwen-2.5-72b-instruct

Strong on Open LLM Leaderboard MMLU-Pro mmlu_pro_accuracy_pct and Open LLM Leaderboard GPQA gpqa

29.1%

Conf 45.3%

anthropic/claude-sonnet-4

Strong on Galileo Agent Leaderboard v2 Avg TSQ and EQ-Bench Leaderboard eq_bench_score

23.7%

Conf 30.6%

Full Comparison with Benchmark Evidence →

Full Use-Case Page Browse All Use Cases How We Score

Related Lookups

Best LLM for Code Generation

Benchmark-backed ranking of models for generating correct, secure code from requirements.

Best LLM for Debugging

Find the top-ranked models for localizing bugs and proposing fixes with explanations.

Best LLM for Unit Test Generation

Ranked models for generating meaningful unit tests and edge cases from code.

Best LLM for Code Review

Compare models for automated PR review covering correctness, security, and maintainability.

Best LLM for Autonomous Coding

Benchmark-backed ranking of models for end-to-end autonomous software engineering and issue resolution.

Best LLM for Function Calling

Compare models for reliable tool use, function selection, and multi-step API orchestration.