benchmark evidence

EQ-Bench v3

Pairwise emotional intelligence benchmark scored across eight EI dimensions. Rubric score 0-100; higher is more emotionally intelligent.

activeEQ evidence ->upstream source ->

winner on EQ-Bench v3

OpenAI: GPT-5.482.4

direct benchmark result, not a broad vertical composite | source row dated 2000-01-01

scored on 2000-01-01 · stale source data (9691d)

latest mapped results | top 20

#	Model	Score	Evidence	Tested
1	OpenAI: GPT-5.4 Openai	82.4	model-only independent_benchmark	2000-01-01
2	OpenAI: GPT-5.5 Openai	82.4	model-only independent_benchmark	2000-01-01
3	OpenAI: GPT-5.2 Openai	80.4	model-only independent_benchmark	2000-01-01
4	Anthropic: Claude Opus 4.6 Anthropic	79.2	model-only independent_benchmark	2000-01-01
5	OpenAI: GPT-5.1 Openai	78.1	model-only independent_benchmark	2000-01-01
6	DeepSeek: DeepSeek V4 Pro Deepseek	77.6	model-only independent_benchmark	2000-01-01
7	Anthropic: Claude Opus 4.5 Anthropic	76.8	model-only independent_benchmark	2000-01-01
8	OpenAI: o3 Openai	74.7	model-only independent_benchmark	2000-01-01
9	DeepSeek: DeepSeek V4 Flash Deepseek	72.5	model-only independent_benchmark	2000-01-01
10	Anthropic: Claude Sonnet 4.5 Anthropic	72.2	model-only independent_benchmark	2000-01-01
11	Anthropic: Claude Opus 4.7 Anthropic	68.2	model-only independent_benchmark	2000-01-01
12	Anthropic: Claude Sonnet 4.6 Anthropic	66.6	model-only independent_benchmark	2000-01-01
13	DeepSeek: R1 Deepseek	65.8	model-only independent_benchmark	2000-01-01
14	OpenAI: GPT-4.1 Openai	64.8	model-only independent_benchmark	2000-01-01
15	OpenAI: o4 Mini Openai	59.4	model-only independent_benchmark	2000-01-01
16	Qwen: Qwen3 235B A22B Qwen	59.1	model-only independent_benchmark	2000-01-01
17	Google: Gemma 3 27B Google	55.6	model-only independent_benchmark	2000-01-01
18	Google: Gemini 2.0 Flash Google	47.4	model-only independent_benchmark	2000-01-01
19	Qwen: Qwen3 32B Qwen	46.4	model-only independent_benchmark	2000-01-01
20	Qwen: Qwen3 30B A3B Qwen	36.7	model-only independent_benchmark	2000-01-01

what this result means

Pairwise emotional intelligence benchmark scored across eight EI dimensions. Rubric score 0-100; higher is more emotionally intelligent.

This benchmark contributes direct public evidence. Read its scope before generalizing the result.

A win here is a win on EQ-Bench v3. Broad task pages require independent corroboration before naming a general winner.

source record

category: eq

metric: accuracy

matched models: 20

latest source date: 2000-01-01

direction: higher is better

inspect upstream source ->