finance

Best LLM for KYC Profile Synthesis

Ranked models for turning identity documents into structured KYC profiles.

#1 Recommendation

gemini-3-pro-preview

Strong on Vals Finance Agent overall_accuracy_pct (87%) and Vals CorpFin v2 overall_accuracy_pct (87%)

external/google/gemini-3-pro-preview

39.8%

Score

51.2%

Confidence

Evidence

Runners-up:#2 gemini-2.5-pro (35.7%)#3 anthropic/claude-sonnet-4.6 (34.6%)#4 Grok-4-0709 (34.2%)

Ranked Models

Evidence Quality

89%

Scoring

Benchmark-backed

Top Signal

Vals Finance Agent: overall_accuracy_pct

All Ranked Models

Open weights only

Max params:

Min confidence:

30 of 30

Rank	Model	Score	Confidence	Evidence	Top Benchmarks
#1	gemini-3-pro-preview Strong on Vals Finance Agent overall_accuracy_pct (87%) and Vals CorpFin v2 overall_accuracy_pct (87%)	39.8%	51.2%	29	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#2	gemini-2.5-pro Strong on FACTS Benchmark Suite facts_grounding_score_pct (100%) and Vals CorpFin v2 overall_accuracy_pct (78%)	35.7%	52.0%	32	FACTS Benchmark Suite facts_grounding_score_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#3	anthropic/claude-sonnet-4.6 Strong on Vals Finance Agent overall_accuracy_pct (100%) and Vals CorpFin v2 overall_accuracy_pct (91%)	34.6%	41.2%	23	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#4	Grok-4-0709	34.2%	47.5%	27	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#5	gpt-5-mini-2025-08-07	33.2%	46.2%	25	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#6	gpt-5-2025-08-07	31.9%	39.7%	22	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#7	openai/gpt-5.4-2026-03-05	31.8%	37.0%	23	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#8	google/gemini-3.1-pro-preview	31.7%	37.4%	24	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#9	gpt-4.1-20250414	30.7%	42.7%	25	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Tax Eval v2 overall_accuracy_pct (Mar 16, 2026)
#10	gpt-5.1-2025-11-13	28.3%	39.7%	22	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#11	gpt-5.2-2025-12-11	27.9%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#12	anthropic/claude-opus-4-6-thinking	27.3%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#13	xai-org/grok-4-fast-reasoning	27.2%	37.0%	23	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#14	xai-org/grok-4-1-fast-reasoning	26.7%	37.0%	23	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#15	gemini-3-flash-preview	26.5%	35.4%	23	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#16	google/gemini-3.1-flash-lite-preview	26.5%	36.7%	22	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#17	claude-sonnet-4-20250514	26.1%	41.0%	24	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) FACTS Benchmark Suite facts_grounding_score_pct (Mar 16, 2026)
#18	anthropic/claude-opus-4-5-20251101-thinking	25.9%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#19	kimi/kimi-k2.5-thinking	25.5%	32.5%	21	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#20	claude-opus-4-5-20251101	24.6%	33.6%	20	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) FACTS Benchmark Suite facts_grounding_score_pct (Mar 16, 2026)
#21	anthropic/claude-sonnet-4-5-20250929-thinking	24.2%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#22	grok/grok-4.20-beta-0309-reasoning	23.8%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#24	alibaba/qwen3.5-flash	22.2%	29.8%	18	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)
#25	zai/glm-5-thinking	22.2%	29.6%	17	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#26	anthropic/claude-haiku-4-5-20251001-thinking	21.5%	30.1%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#27	mistralai/mistral-large-2512	19.0%	36.3%	21	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Tax Eval v2 overall_accuracy_pct (Mar 16, 2026)
#28	xai-org/grok-4-1-fast-non-reasoning	18.9%	36.7%	22	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#29	z-ai/glm-4.7	18.4%	28.7%	19	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 shared_max_context_accuracy_pct (Mar 16, 2026)
#30	qwen/qwen3-max	18.2%	27.6%	16	Vals Finance Agent overall_accuracy_pct (Mar 16, 2026) Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026)
#31	Kimi K2 Thinking	17.9%	30.0%	18	Vals CorpFin v2 overall_accuracy_pct (Mar 16, 2026) Vals Finance Agent overall_accuracy_pct (Mar 16, 2026)

Head-to-Head: #1 vs #2

Top Pick

gemini-3-pro-preview

Strong on Vals Finance Agent overall_accuracy_pct (87%) and Vals CorpFin v2 overall_accuracy_pct (87%)

39.8%

Conf 51.2%

gemini-2.5-pro

Strong on FACTS Benchmark Suite facts_grounding_score_pct (100%) and Vals CorpFin v2 overall_accuracy_pct (78%)

35.7%

Conf 52.0%

Full Comparison with Benchmark Evidence →

Full Use-Case Page Browse All Use Cases How We Score

Related Lookups

Best LLM for Code Generation

Benchmark-backed ranking of models for generating correct, secure code from requirements.

Best LLM for Debugging

Find the top-ranked models for localizing bugs and proposing fixes with explanations.

Best LLM for Unit Test Generation

Ranked models for generating meaningful unit tests and edge cases from code.

Best LLM for Code Review

Compare models for automated PR review covering correctness, security, and maintainability.

Best LLM for Refactoring

Ranked models for safely refactoring code while preserving behavior and improving clarity.

Best LLM for IDE Code Completion

Compare models for fast, accurate local-context code completion and snippet generation.