AI 排行榜by CocoLoop

Leaderboard · Text

文本模型排行榜

基于真实用户盲测投票与 MMLU / GPQA / 长文本评测等加权，展示当前主流文本大模型的真实能力排名。

更新日期 · 2026-044,863,241 次投票50 个文本模型

#

模型

厂商

国家

强项

关键规格

Arena

趋势

GPT-5 最新小版本，综合提升

Claude Opus 4.7

Agent 与复杂工程任务最强

OpenAI 专用推理，数学 / 编程 SOTA

Google 旗舰，多模态推理最强

最新 snapshot，推理略有提升

全模态通用能力最均衡

Claude Sonnet 4.7

综合能力强，性价比最优选

2M 长上下文与视频理解

DeepSeek R2开源

开源推理旗舰，性价比碾压

Claude Opus 4.6

上一代 Opus，生态仍广泛在用

GPT-5.3 小尺寸，速度与便宜并重

Grok 4部分开源

实时 X 数据 + 数理推理

Claude Opus 4.5

更早一代 Opus，历史参考

DeepSeek V4开源

开源推理冠军，极致性价比

o4 轻量版，推理便宜好用

1M 上下文 + 速度 + 便宜

GPT-5 (initial)

GPT-5 首发版本，迁移在途

中文场景闭源第一梯队

Gemini 上一代旗舰

Kimi K2部分开源

2M 中文长文档阅读之王

Grok 4 Fast部分开源

Grok 小尺寸，保留实时搜索

Llama 4 405B开源

开源最强，企业可自部署

Qwen 3 72B开源

Qwen 开源旗舰，可自部署

GLM-5部分开源

国产 Agent 与工具调用专长

Claude Haiku 4.7

Claude 家族最便宜最快

GPT-5.3 最小版，极低延迟

老牌通用模型，生态最成熟

Mistral Large 3部分开源

欧洲合规，代码能力突出

Kimi K1.5部分开源

Kimi 上一代，长文档老牌

Yi Large 2部分开源

零一万物旗舰，综合均衡

端侧小模型，设备离线运行

GLM-5 Air开源

GLM-5 开源轻量版，可商用

百度文心旗舰，搜索整合

Command R+ 2部分开源

企业级 RAG 首选

豆包旗舰，抖音生态赋能

Mistral Medium 3部分开源

中号通用，价格甜区

Hunyuan Large部分开源

腾讯混元，MoE 架构

Codestral 3开源

Mistral 代码模型专版

AWS 原生模型，云集成强

Step 2部分开源

阶跃星辰万亿参数模型

Baichuan 5部分开源

百川智能旗舰，医疗场景强

海螺语言模型 abab 系列

小模型代表，14B 参数

InternLM 3开源

Shanghai AI Lab

书生浦语开源，学术强

Llama 3.3 70B开源

社区最常用的 70B 开源

商汤日日新，视觉基因

Spark 5部分开源

科大讯飞，语音生态强

Skywork 4开源

昆仑万维开源，长文本

Databricks 开源 MoE 模型

Nemotron 4 340B开源

NVIDIA 合成数据训练

AI 模型排行榜（CocoLoop）· 基于真实用户盲测投票与权威基准评测的 AI 大模型排名。请启用 JavaScript 查看完整榜单。访问 top.cocoloop.cn。