Model Profile

GLM-4.5

Name: GLM-4.5
Rating: 1.0 (51 reviews)
Author: zai-org

4,096 ctxOpen weights

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: zai-org/GLM-4.5

Author: zai-org

Origin: huggingface_catalog

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 11.7%

Evidence points: 51

Raw rows: 101

Weighted rows: 7

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 33,921

Intelligence Profile

Dimension Breakdown

IQ2 benchmarks

70.6%*

EQ1 benchmark

93.3%*

Accuracy1 benchmark

80.8%*

Creativity2 benchmarks

84.3%*

Based1 benchmark

76.0%*

* Low confidence — limited benchmark evidence for this dimension

5/5 dimensions scored · Last updated Apr 14, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

SWE-bench Verified Leaderboard

swe_verified_resolved_pct

4.4%

Normalized value 80.8% · confidence 100.0%

Strongest impact in Verilog/VHDL generation

swebench_verified_official.swe_verified_resolved_pct · Apr 1, 2026

EQ-Bench Leaderboard

eq_bench_score

4.1%

Normalized value 93.3% · confidence 100.0%

Strongest impact in Social post generation

eq_bench.eq_bench_score · Apr 1, 2026

UGI Leaderboard

Entertainment

3.0%

Normalized value 94.7% · confidence 100.0%

Strongest impact in Adult ERP roleplay (explicit)

ugi_main.entertainment · Apr 1, 2026

UGI Leaderboard

Writing ✍️

2.7%

Normalized value 74.6% · confidence 100.0%

Strongest impact in Adult ERP roleplay (explicit)

ugi_main.writing · Apr 1, 2026

MathArena Models

average_score_pct

0.5%

Normalized value 51.3% · confidence 100.0%

Strongest impact in Social post generation

matharena_models.average_score_pct · Apr 1, 2026

SciArena Leaderboard

rating_elo

0.3%

Normalized value 53.0% · confidence 100.0%

Strongest impact in Social post generation

sciarena_leaderboard.rating_elo · Apr 1, 2026

Some fit rows have limited benchmark evidence.

12 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

Total Measurements

101

Weighted Measurements

Weighted Sources

Raw Source Coverage

ugi_main 60swe_bench_additional_public 12swe_bench_leaderboard 12sciarena_leaderboard 7swebench_bash_only_official 4matharena_models 2

Weighted Source Coverage

ugi_main 3eq_bench 1matharena_models 1sciarena_leaderboard 1swebench_verified_official 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Poetry and lyrics use_case.creative.poetry_lyrics	creative	10.3%	12.9%	5	UGI Leaderboard: Entertainment
Screenplay scene writing use_case.creative.screenplay_scene	creative	10.3%	12.9%	5	UGI Leaderboard: Entertainment
Social post generation use_case.mkt.social_post_generation	marketing_sales	9.6%	11.9%	4	EQ-Bench Leaderboard: eq_bench_score
Campaign brief use_case.mkt.campaign_brief	marketing_sales	9.6%	11.9%	4	EQ-Bench Leaderboard: eq_bench_score
Product positioning and messaging use_case.mkt.product_positioning	marketing_sales	9.6%	11.9%	4	EQ-Bench Leaderboard: eq_bench_score
Verilog/VHDL generation use_case.eda.verilog_generation	engineering	9.4%	11.9%	4	SWE-bench Verified Leaderboard: swe_verified_resolved_pct
Personalized sales outreach use_case.mkt.sales_outreach_personalized	marketing_sales	9.1%	11.2%	4	EQ-Bench Leaderboard: eq_bench_score
Ad copy variants use_case.mkt.ad_copy_variants	marketing_sales	9.1%	11.2%	4	EQ-Bench Leaderboard: eq_bench_score
Adult ERP roleplay (explicit) use_case.adult.erp_roleplay	adult	9.1%	11.2%	5	UGI Leaderboard: Entertainment
Kubernetes manifest generation use_case.sre.iac_k8s	devops_sre	8.6%	11.2%	4	SWE-bench Verified Leaderboard: swe_verified_resolved_pct
Terraform generation use_case.sre.iac_terraform	devops_sre	8.6%	11.2%	4	SWE-bench Verified Leaderboard: swe_verified_resolved_pct
Config debugging use_case.sre.config_debugging	devops_sre	8.6%	11.2%	4	SWE-bench Verified Leaderboard: swe_verified_resolved_pct