马斯?xAI "博士? AI,地球最强大模型
2025???/p>
xAI(马斯克创立?/p>
256K tokens(多模态)
SuperGrok $30/??$3000/?/p>
首代模型,幽默对话风?/p>
性能提升,支持图像生?/p>
思维链推理,10?H100 训练
跳过 3.5,AIME 2025 满分,博士级能力
全能多模态模型,博士级能?/p>
多智能体系统,AIME 2025 满分
1/25 成本达到 Gemini 2.5 Pro 水平
马斯克称"各方面达到研究生甚至博士水平"
AIME 2025 满分,超越所有竞?/p>
图像生成/编辑?025.8)、视频(2025.9-10?/p>
X/Twitter 平台实时数据访问
Grok 4 Heavy 多智能体协作
叛逆有趣,敢于讨论敏感话题
| 测试 | Grok 4 Heavy | GPT-5.2 Pro | Gemini 3 Pro | Claude Opus 4.5 |
|---|---|---|---|---|
| AIME 2025 | 100% 满分 | ~85% | ~80% | ~75% |
| 数学推理 | 最?/td> | ?/td> | ?/td> | ?/td> |
| Agent 能力 | ?Agent | ?Agent | Antigravity | Computer Use |
| 实时数据 | X 平台 | 联网搜索 | Google 搜索 | ?/td> |
| 上下?/td> | 256K | ~400K | 100?/td> | 200K |
AIME 满分级别的数学推?/p>
X 平台热点、舆情分?/p>
多步骤自动化任务(Heavy?/p>
幽默风格、无过多限制
Heavy 是多智能体系统,适合复杂推理任务,在 AIME 等数学测试中表现更强。普通版适合日常使用?
对于需要顶级数学推理、研究级任务的用户值得。普通用?$16/月的 Premium+ 足够?/p>
支持,但英文效果更好?/p>
xAI 直接?Grok 3 跳到 Grok 4,展示在 AI 竞赛中加速前进的决心?/p>