Grok3翻车了回答9.11比9.9大

砸20万张显卡训练出的‘宇宙级AI’，竟分不清9.11和9.9哪个大？马斯克翻车实录！”

“当马斯克在发布会上用Grok3生成火星轨道代码时，网友却在直播间疯狂刷屏：‘先教它算数行吗？’——这款号称‘理解宇宙’的AI，一边解着博士级数学题，一边把‘9.11和9.9谁大’答成‘需要更多上下文’，魔幻现实让全球程序员集体破防。”

---

一、高调发布VS现实翻车：AI圈的‘皇帝新衣’

马斯克宣称Grok3是“地球上最聪明的人工智能”，在数学、科学、编程等领域“吊打GPT-4o和DeepSeek”。发布会上，Grok3秀了一波高光操作：计算地球到火星往返轨道、融合《俄罗斯方块》和《宝石迷阵》创造新游戏，甚至能解决博士级别的科学问题。然而，网友实测却让这场科技盛宴秒变翻车现场——

- **基础常识崩塌**：被问“9.11和9.9哪个大”，Grok3回答“需要更多上下文”；面对“比萨斜塔两球下落”的经典物理题，它一本正经地分析空气阻力，却忽略重力加速度。网友吐槽：“这AI怕不是马斯克找代练刷的分？”

- **游戏人设崩塌**：直播中马斯克让Grok3分析《流放之路2》职业攻略，结果输出错误答案，他却浑然不觉，被网友抓包“游戏菜鸟装大佬”。

- **榜单水分争议**：官方PPT展示Grok3在Chatbot Arena“遥遥领先”，但细看纵轴仅截取1400-1300分段，实际得分仅比DeepSeek R1高不到100分。业内人士直言：“这就是把1%的优势P成断层第一！”

一边吹嘘“诺贝尔级突破”，一边连小学数学题都翻车，Grok3像极了简历造假还硬凹精英人设的求职者。

---

二、算力堆砌VS边际效应：263倍成本换1%进步？

Grok3最令人咋舌的不是智商，而是“烧钱力”——训练用了20万张H100显卡，算力消耗是DeepSeek V3的263倍，但实际能力提升仅1%-2%。这暴露出AI行业两大荒诞现实：

Grok3翻车了 回答9.11比9.9大