Model Profile

qwen-2.5-coder32b-instruct

Name: qwen-2.5-coder32b-instruct
Rating: 2.0 (188 reviews)
Author: qwen

External Benchmark Shadowexternal_benchmark_shadowpublic

4,096 ctx

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: external/qwen/qwen-2-5-coder32b-instruct

Author: qwen

Origin: external_benchmark_shadow

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 34.4%

Evidence points: 188

Raw rows: 93

Weighted rows: 22

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 0

Intelligence Profile

Dimension Breakdown

IQ7 benchmarks

51.7%

EQ4 benchmarks

75.5%*

Accuracy3 benchmarks

55.3%*

Creativity4 benchmarks

61.7%*

Based2 benchmarks

44.9%*

* Low confidence — limited benchmark evidence for this dimension

5/5 dimensions scored · Last updated Apr 30, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

DuckDB NSQL Leaderboard

all_execution_accuracy

7.7%

Normalized value 82.7% · confidence 100.0%

Strongest impact in Metric definition workshop

duckdb_nsql_leaderboard.all_execution_accuracy · Apr 30, 2026

Open LLM Leaderboard MMLU-Pro

mmlu_pro_accuracy_pct

3.3%

Normalized value 54.2% · confidence 100.0%

Strongest impact in Data quality assistant

openllm_mmlu_pro_official.mmlu_pro_accuracy_pct · Apr 30, 2026

Open LLM Leaderboard GPQA

gpqa

2.7%

Normalized value 44.9% · confidence 100.0%

Strongest impact in Data quality assistant

openllm_gpqa_official.gpqa · Apr 30, 2026

BigCode Models Leaderboard

average_score

2.5%

Normalized value 100.0% · confidence 100.0%

Strongest impact in IDE code completion

bigcode_models_leaderboard.average_score · Apr 29, 2026

BigCodeBench Official

bigcodebench_complete_pct

2.0%

Normalized value 91.9% · confidence 100.0%

Strongest impact in IDE code completion

bigcodebench_official.bigcodebench_complete_pct · Apr 29, 2026

BigCodeBench Official

bigcodebench_instruct_pct

1.7%

Normalized value 95.2% · confidence 100.0%

Strongest impact in IDE code completion

bigcodebench_official.bigcodebench_instruct_pct · Apr 29, 2026

Coverage Diagnostics

actively scored

Use-Case Scores

149

Total Measurements

Weighted Measurements

Weighted Sources

Raw Source Coverage

bigcode_models_leaderboard 16duckdb_nsql_leaderboard 12swe_bench_additional_public 12swe_bench_leaderboard 12artifactsbenchmark_leaderboard 11bigcodebench_official 8

Weighted Source Coverage

bigcodebench_official 3aider_code_editing 2aider_polyglot 2bigcode_models_leaderboard 2duckdb_nsql_leaderboard 2swe_bench_leaderboard 2

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Integration test generation use_case.dev.integration_tests	developer_tools	20.4%	37.7%	17	BigCode Models Leaderboard: average_score
Simulation setup assistant use_case.eng.simulation_setup_assistant	engineering	19.9%	40.1%	13	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Verilog/VHDL generation use_case.eda.verilog_generation	engineering	19.8%	41.4%	16	BigCode Models Leaderboard: average_score
IDE code completion use_case.dev.ide_completion	developer_tools	17.8%	32.9%	17	BigCode Models Leaderboard: average_score
CAD scripting helper use_case.eng.cad_scripting_helper	engineering	16.1%	33.7%	16	BigCode Models Leaderboard: average_score
Metric definition workshop use_case.data.metric_definition_workshop	data_analytics	16.0%	40.0%	11	DuckDB NSQL Leaderboard: all_execution_accuracy
Data quality assistant use_case.data.data_quality_assistant	data_analytics	15.8%	36.5%	11	DuckDB NSQL Leaderboard: all_execution_accuracy
Release notes drafting use_case.dev.release_notes	developer_tools	15.7%	29.2%	18	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Documentation from code use_case.dev.docstrings_and_docs	developer_tools	15.6%	28.9%	18	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Refactoring assistant use_case.dev.refactoring	developer_tools	15.3%	33.9%	17	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct
Code Review Assistant use_case.dev.code_review_assistant	developer_tools	15.2%	30.2%	17	BigCode Models Leaderboard: average_score
Unit test generation use_case.dev.test_generation	developer_tools	14.7%	28.4%	17	Open LLM Leaderboard MMLU-Pro: mmlu_pro_accuracy_pct