AI 大模型评测与记录 · 数据来源: Artificial Analysis
Google 最新旗舰多模态模型,Artificial Analysis Intelligence Index 排名第一(57分,领先第二名4分),成本不到竞品一半。支持长上下文和高级推理。
OpenAI 最新模型,Intelligence Index 顶级水平。推理和代码能力极强。
OpenAI 代码专用模型,Coding Index 极高。适合编程任务。
Anthropic 最新 Claude 模型,写作和推理能力顶级。
目前最快的模型,输出速度 750 tokens/s。适合实时应用。
MiniMax 最新版,主打自我进化与实战提升,响应速度快,性价比高。
IBM Granite 系列高速版本,602 tokens/s,性价比极高。
Google 轻量快速版本,延迟低,适合需要快速响应的场景。
Google 最便宜的模型,每百万 tokens 仅需 $0.03。开源可本地部署。
Meta 第二代大模型,每百万 tokens $0.05,性能优秀。
Amazon Nova 轻量版,价格低廉,适合简单任务。
Meta 最大的开源模型,上下文窗口达到 10M tokens。适合大规模 RAG。
xAI Grok 系列,上下文 2M tokens。Elon Musk 的 AI 项目。
Google 实验版 Pro 模型,上下文窗口极大。
DeepSeek 最新一代开源 MoE 模型(671B参数,37B活跃),推理能力极强,中文优化良好。$0.014/M输入。
阿里通义千问推理模型,32B参数,Apache 2.0开源,32.8K上下文。$0.15/M输入,适合复杂多步推理链。
阿里通义千问最新版,中文优化,开源可本地部署。
法国 Mistral AI 开源模型系列,轻量高效。
中国 DeepSeek 发布的推理模型,推理能力极强,低延迟 (0.35s)。
阿里通义千问推理模型,32B参数,开源,Apache 2.0许可,32.8K上下文。擅长复杂多步推理链。
OpenAI 最新模型,Intelligence Index 顶级水平,推理和代码能力极强。
MiniMax 2026年3月新版,主打自我进化与实战能力提升。$0.30/M输入 / $1.20/M输出,上下文205K。
智谱 AI 多模态模型,2026-03-06 至 2026-03-18 期间使用。
MiniMax 早期高速版本,2026-03-05 之前的主力模型。