砸20万张显卡训练出的‘宇宙级AI’,竟分不清9.11和9.9哪个大?马斯克翻车实录!”
“当马斯克在发布会上用Grok3生成火星轨道代码时,网友却在直播间疯狂刷屏:‘先教它算数行吗?’——这款号称‘理解宇宙’的AI,一边解着博士级数学题,一边把‘9.11和9.9谁大’答成‘需要更多上下文’,魔幻现实让全球程序员集体破防。”
---
一、高调发布VS现实翻车:AI圈的‘皇帝新衣’
马斯克宣称Grok3是“地球上最聪明的人工智能”,在数学、科学、编程等领域“吊打GPT-4o和DeepSeek”。发布会上,Grok3秀了一波高光操作:计算地球到火星往返轨道、融合《俄罗斯方块》和《宝石迷阵》创造新游戏,甚至能解决博士级别的科学问题。然而,网友实测却让这场科技盛宴秒变翻车现场——

- **基础常识崩塌**:被问“9.11和9.9哪个大”,Grok3回答“需要更多上下文”;面对“比萨斜塔两球下落”的经典物理题,它一本正经地分析空气阻力,却忽略重力加速度。网友吐槽:“这AI怕不是马斯克找代练刷的分?”
- **游戏人设崩塌**:直播中马斯克让Grok3分析《流放之路2》职业攻略,结果输出错误答案,他却浑然不觉,被网友抓包“游戏菜鸟装大佬”。
- **榜单水分争议**:官方PPT展示Grok3在Chatbot Arena“遥遥领先”,但细看纵轴仅截取1400-1300分段,实际得分仅比DeepSeek R1高不到100分。业内人士直言:“这就是把1%的优势P成断层第一!”
一边吹嘘“诺贝尔级突破”,一边连小学数学题都翻车,Grok3像极了简历造假还硬凹精英人设的求职者。
---
二、算力堆砌VS边际效应:263倍成本换1%进步?
Grok3最令人咋舌的不是智商,而是“烧钱力”——训练用了20万张H100显卡,算力消耗是DeepSeek V3的263倍,但实际能力提升仅1%-2%。这暴露出AI行业两大荒诞现实: