MMLU

conceptai_benchmark

Overview

Open source✓ Open Source

Use casemeasuring language model knowledge across 57 academic subjects from STEM to humanities

Also see

Alternative to

Knowledge graph stats

Claims8

Avg confidence97%

Avg freshness99%

Last updatedUpdated 13h ago

Trust distribution

100% unverified

Governance

Not assessed

MMLU

concept — also known as: Massive Multitask Language Understanding

Massive Multitask Language Understanding benchmark covering 57 academic subjects

used by

Value	Trust	Confidence	Freshness	Sources
Google	○Unverified	High	Fresh	1
OpenAI	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
GPQA	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
world knowledge and problem-solving ability	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
true	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
measuring language model knowledge across 57 academic subjects from STEM to humanities	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
Dan Hendrycks et al.	○Unverified	High	Fresh	1

Value	Trust	Confidence	Freshness	Sources
2020	○Unverified	High	Fresh	1

alternative to

Claim count: 8Last updated: 4/10/2026Edit history