Leaderboard · Text
文本模型排行榜
基于真实用户盲测投票与 MMLU / GPQA / 长文本评测等加权,展示当前主流文本大模型的真实能力排名。
更新日期 · 2026-044,863,241 次投票50 个文本模型
#
模型
厂商
国家
强项
关键规格
Arena
趋势
01
GPT-5.5
OpenAI
US
GPT-5 最新小版本,综合提升
400K tokens
上下文
1430
6
02
Claude Opus 4.7
Anthropic
US
Agent 与复杂工程任务最强
500K tokens
上下文
1428
5
03
o4
OpenAI
US
OpenAI 专用推理,数学 / 编程 SOTA
200K tokens
上下文
1425
6
04
Gemini 3 Ultra
Google
US
Google 旗舰,多模态推理最强
2M tokens
上下文
1420
4
05
GPT-5.4
OpenAI
US
最新 snapshot,推理略有提升
256K tokens
上下文
1416
8
06
GPT-5.3
OpenAI
US
全模态通用能力最均衡
256K tokens
上下文
1411
2
07
Claude Sonnet 4.7
Anthropic
US
综合能力强,性价比最优选
200K tokens
上下文
1398
3
08
Gemini 3 Pro
Google
US
2M 长上下文与视频理解
2M tokens
上下文
1395
1
09
DeepSeek R2开源
DeepSeek
CN
开源推理旗舰,性价比碾压
128K tokens
上下文
1395
15
10
Claude Opus 4.6
Anthropic
US
上一代 Opus,生态仍广泛在用
200K tokens
上下文
1390
6
11
GPT-5.3 Mini
OpenAI
US
GPT-5.3 小尺寸,速度与便宜并重
256K tokens
上下文
1389
4
12
Grok 4部分开源
xAI
US
实时 X 数据 + 数理推理
256K tokens
上下文
1388
7
13
Claude Opus 4.5
Anthropic
US
更早一代 Opus,历史参考
200K tokens
上下文
1378
10
14
DeepSeek V4开源
DeepSeek
CN
开源推理冠军,极致性价比
128K tokens
上下文
1372
11
15
o4-mini
OpenAI
US
o4 轻量版,推理便宜好用
200K tokens
上下文
1372
5
16
Gemini 3 Flash
Google
US
1M 上下文 + 速度 + 便宜
1M tokens
上下文
1370
2
17
GPT-5 (initial)
OpenAI
US
GPT-5 首发版本,迁移在途
128K tokens
上下文
1368
12
18
Qwen 3 Max
Alibaba
CN
中文场景闭源第一梯队
128K tokens
上下文
1358
4
19
Gemini 2.5 Pro
Google
US
Gemini 上一代旗舰
2M tokens
上下文
1358
8
20
Kimi K2部分开源
Moonshot AI
CN
2M 中文长文档阅读之王
2M tokens
上下文
1355
4
21
Grok 4 Fast部分开源
xAI
US
Grok 小尺寸,保留实时搜索
128K tokens
上下文
1350
3
22
Llama 4 405B开源
Meta
US
开源最强,企业可自部署
128K tokens
上下文
1342
3
23
Qwen 3 72B开源
Alibaba
CN
Qwen 开源旗舰,可自部署
128K tokens
上下文
1340
2
24
GLM-5部分开源
Zhipu AI
CN
国产 Agent 与工具调用专长
128K tokens
上下文
1338
3
25
Claude Haiku 4.7
Anthropic
US
Claude 家族最便宜最快
200K tokens
上下文
1335
1
26
GPT-5.3 Nano
OpenAI
US
GPT-5.3 最小版,极低延迟
128K tokens
上下文
1330
—
27
GPT-4o
OpenAI
US
老牌通用模型,生态最成熟
128K tokens
上下文
1328
8
28
Mistral Large 3部分开源
Mistral
FR
欧洲合规,代码能力突出
128K tokens
上下文
1325
1
29
Kimi K1.5部分开源
Moonshot AI
CN
Kimi 上一代,长文档老牌
1M tokens
上下文
1320
3
30
Yi Large 2部分开源
01.AI
CN
零一万物旗舰,综合均衡
128K tokens
上下文
1310
2
31
Gemini 3 Nano
Google
US
端侧小模型,设备离线运行
32K tokens
上下文
1310
—
32
GLM-5 Air开源
Zhipu AI
CN
GLM-5 开源轻量版,可商用
128K tokens
上下文
1305
2
33
ERNIE 5
Baidu
CN
百度文心旗舰,搜索整合
128K tokens
上下文
1300
1
34
Command R+ 2部分开源
Cohere
CA
企业级 RAG 首选
128K tokens
上下文
1300
3
35
Doubao Pro 2
ByteDance
CN
豆包旗舰,抖音生态赋能
128K tokens
上下文
1298
2
36
Mistral Medium 3部分开源
Mistral
FR
中号通用,价格甜区
128K tokens
上下文
1295
—
37
Hunyuan Large部分开源
Tencent
CN
腾讯混元,MoE 架构
256K tokens
上下文
1290
1
38
Codestral 3开源
Mistral
FR
Mistral 代码模型专版
128K tokens
上下文
1285
4
39
Nova Pro 2
Amazon
US
AWS 原生模型,云集成强
300K tokens
上下文
1285
2
40
Step 2部分开源
StepFun
CN
阶跃星辰万亿参数模型
256K tokens
上下文
1280
3
41
Baichuan 5部分开源
Baichuan
CN
百川智能旗舰,医疗场景强
192K tokens
上下文
1275
—
42
MiniMax abab 7
MiniMax
CN
海螺语言模型 abab 系列
128K tokens
上下文
1275
2
43
Phi-4开源
Microsoft
US
小模型代表,14B 参数
128K tokens
上下文
1270
1
44
InternLM 3开源
Shanghai AI Lab
CN
书生浦语开源,学术强
256K tokens
上下文
1270
2
45
Llama 3.3 70B开源
Meta
US
社区最常用的 70B 开源
128K tokens
上下文
1268
3
46
SenseNova 6
SenseTime
CN
商汤日日新,视觉基因
128K tokens
上下文
1265
1
47
Spark 5部分开源
iFLYTEK
CN
科大讯飞,语音生态强
128K tokens
上下文
1260
—
48
Skywork 4开源
Kunlun Tech
CN
昆仑万维开源,长文本
200K tokens
上下文
1255
1
49
DBRX开源
Databricks
US
Databricks 开源 MoE 模型
32K tokens
上下文
1250
5
50
Nemotron 4 340B开源
NVIDIA
US
NVIDIA 合成数据训练
4K tokens
上下文
1238
4