首页 > 生活学习 > 生活学习 > Grok3翻车了 回答9.11比9.9大

Grok3翻车了 回答9.11比9.9大

发布时间:2025-02-19 15:52:05

砸20万张显卡训练出的‘宇宙级AI’,竟分不清9.11和9.9哪个大?马斯克翻车实录!”

 

“当马斯克在发布会上用Grok3生成火星轨道代码时,网友却在直播间疯狂刷屏:‘先教它算数行吗?’——这款号称‘理解宇宙’的AI,一边解着博士级数学题,一边把‘9.11和9.9谁大’答成‘需要更多上下文’,魔幻现实让全球程序员集体破防。”

 

---

 

一、高调发布VS现实翻车:AI圈的‘皇帝新衣’

马斯克宣称Grok3是“地球上最聪明的人工智能”,在数学、科学、编程等领域“吊打GPT-4o和DeepSeek”。发布会上,Grok3秀了一波高光操作:计算地球到火星往返轨道、融合《俄罗斯方块》和《宝石迷阵》创造新游戏,甚至能解决博士级别的科学问题。然而,网友实测却让这场科技盛宴秒变翻车现场——

 

- **基础常识崩塌**:被问“9.11和9.9哪个大”,Grok3回答“需要更多上下文”;面对“比萨斜塔两球下落”的经典物理题,它一本正经地分析空气阻力,却忽略重力加速度。网友吐槽:“这AI怕不是马斯克找代练刷的分?”

- **游戏人设崩塌**:直播中马斯克让Grok3分析《流放之路2》职业攻略,结果输出错误答案,他却浑然不觉,被网友抓包“游戏菜鸟装大佬”。

- **榜单水分争议**:官方PPT展示Grok3在Chatbot Arena“遥遥领先”,但细看纵轴仅截取1400-1300分段,实际得分仅比DeepSeek R1高不到100分。业内人士直言:“这就是把1%的优势P成断层第一!”

 

一边吹嘘“诺贝尔级突破”,一边连小学数学题都翻车,Grok3像极了简历造假还硬凹精英人设的求职者。

 

---

 

二、算力堆砌VS边际效应:263倍成本换1%进步?

Grok3最令人咋舌的不是智商,而是“烧钱力”——训练用了20万张H100显卡,算力消耗是DeepSeek V3的263倍,但实际能力提升仅1%-2%。这暴露出AI行业两大荒诞现实:

生活学习更多>>

深圳低空经济全面发力,无人机航线近300条完成170万架次飞行 三星显示发布20000尼特XR头显专用RGB OLEDoS屏幕 全球首个具身智能机器人4S店官宣亮相北京 新书上市半月,苏童再谈《好天气》 生活的烟火气在笔墨里的诗意浪漫 珠山八友瓷板画新老鉴定全攻略:从技法到细节综合鉴别指南! 为什么文学作品中经常出现办不成事的人? 郭小东:说《蒲蛰龙传》 边缘之烛:《红楼梦》中香菱的隐喻光辉 直播带货的现状与未来:风口之下,如何抓住下一个红利期? 直播建盏假开窑如何做到以假乱真? 用户心愿单加速实现!鸿蒙版微信上线图片编辑等近十项实用功能 Deepseek支招:理财小白必看!支付宝和微信定期大PK 耳夹式耳机怎么样?荣耀、南卡、Bose 三大热门耳机大pk LG显示屏变身术!一块秒变两块,这年头连显示器都学会分裂了? 海尔空调 一城一气候暨银座电器&海尔空调第三届舒适凉爽节启动 智能机器人亮相车站,带来哪些新服务? 广西崇左:积极探索人工智能在教育中的应用 AI教育:是“技术赋能”,还是“技术僭越”? AI时代的物流创新:人类依然是决策核心 苹果可折叠手机iPhone Flip显示屏将更省电 有望成为顶尖折叠机 苹果iOS 19或将迎来重大界面革新 苹果开启无接口iPhone研发?最大障碍已扫清 招41人!衢江区事业单位招聘 南京市2025年事业单位 统一公开招聘工作人员公告 拟招聘139人!宜宾应届毕业生国资专聘行动正在报名 北京市人大常委会机关所属事业单位公开招聘2025年应届毕业生公告 通州区2025年事业单位拟招聘224人 运城市中心医院诚聘英才 20个岗位60人,期待您的加入 洛龙区、孟津区发布 最新招聘公告 公开招聘公益性岗位人员 共计138人