Model Profile

qwen-2.5-coder7b-instruct

Name: qwen-2.5-coder7b-instruct
Rating: 2.0 (107 reviews)
Author: qwen

External Benchmark Shadowexternal_benchmark_shadowpublic

4,096 ctx

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: external/qwen/qwen-2-5-coder7b-instruct

Author: qwen

Origin: external_benchmark_shadow

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 27.2%

Evidence points: 107

Raw rows: 114

Weighted rows: 17

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 0

Intelligence Profile

Dimension Breakdown

IQ7 benchmarks

26.5%

EQ4 benchmarks

55.4%*

Accuracy2 benchmarks

68.3%*

Creativity6 benchmarks

26.0%

Based3 benchmarks

15.7%*

* Low confidence — limited benchmark evidence for this dimension

5/5 dimensions scored · Last updated Apr 30, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

DuckDB NSQL Leaderboard

all_execution_accuracy

6.6%

Normalized value 71.1% · confidence 100.0%

Strongest impact in Metric definition workshop

duckdb_nsql_leaderboard.all_execution_accuracy · Apr 30, 2026

JSONSchemaBench Leaderboard

medium_schema_compliance_pct

3.6%

Normalized value 82.6% · confidence 100.0%

Strongest impact in Metric definition workshop

jsonschemabench_leaderboard.medium_schema_compliance_pct · Apr 30, 2026

DuckDB NSQL Leaderboard

hard_execution_accuracy

2.6%

Normalized value 50.0% · confidence 100.0%

Strongest impact in SQL debugging

duckdb_nsql_leaderboard.hard_execution_accuracy · Apr 30, 2026

Open LLM Leaderboard MMLU-Pro

mmlu_pro_accuracy_pct

2.3%

Normalized value 37.4% · confidence 100.0%

Strongest impact in Claims summary

openllm_mmlu_pro_official.mmlu_pro_accuracy_pct · Apr 30, 2026

JSONSchemaBench Leaderboard

hard_schema_compliance_pct

2.0%

Normalized value 66.9% · confidence 100.0%

Strongest impact in Metric definition workshop

jsonschemabench_leaderboard.hard_schema_compliance_pct · Apr 30, 2026

Open LLM Leaderboard IFEval

ifeval

1.5%

Normalized value 68.3% · confidence 100.0%

Strongest impact in Tail spend categorization

openllm_ifeval_official.ifeval · Apr 30, 2026

Some fit rows have limited benchmark evidence.

5 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

148

Total Measurements

114

Weighted Measurements

Weighted Sources

Raw Source Coverage

ugi_main 60duckdb_nsql_leaderboard 12jsonschemabench_leaderboard 12artifactsbenchmark_leaderboard 11bigcodebench_official 8open_llm_leaderboard_results 5

Weighted Source Coverage

bigcodebench_official 3ugi_main 3aider_code_editing 2duckdb_nsql_leaderboard 2jsonschemabench_leaderboard 2open_llm_leaderboard_results 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Metric definition workshop use_case.data.metric_definition_workshop	data_analytics	19.9%	35.4%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
SQL debugging use_case.data.sql_debugging	data_analytics	16.1%	30.1%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
Data quality assistant use_case.data.data_quality_assistant	data_analytics	16.1%	32.3%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
Insight mining from text corpora use_case.data.insight_mining	data_analytics	15.7%	29.4%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
Executive brief from metrics use_case.data.exec_brief_from_metrics	data_analytics	14.8%	29.8%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
Text-to-SQL analyst assistant use_case.data.text_to_sql	data_analytics	14.1%	25.4%	9	DuckDB NSQL Leaderboard: all_execution_accuracy
Candidate summary memo use_case.hr.candidate_summary	hr_recruiting	11.2%	24.8%	9	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Claims summary use_case.ins.claims_summary	insurance	10.7%	25.1%	8	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Tail spend categorization use_case.proc.tail_spend_categorization	supply_chain	10.7%	23.8%	9	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Simulation setup assistant use_case.eng.simulation_setup_assistant	engineering	10.7%	24.4%	9	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Interview question bank use_case.hr.interview_question_bank	hr_recruiting	10.4%	23.0%	9	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Resume structuring use_case.hr.resume_structuring	hr_recruiting	10.2%	22.4%	9	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct