号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

超人手游网 02-19 阅读 38评论

感谢本站网友有鲫雪狐、朱丶工作室的线索投递！

本站 2 月 19 日消息，昨天马斯克及其 xAI 团队在直播中正式发布了 Grok 3，此前马斯克通过持续的预热宣传，将外界对 Grok3 的期待值推向了前所未有的高度。马斯克称 Grok 3为“地球上最聪明的人工智能”，然而其实际表现似乎对不起这个名号。

本站注意到，在发布会上，马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型，并计划将其应用于 SpaceX 的火星任务计算，甚至预测未来三年内将实现诺贝尔奖级别的突破。

但 Grok3 的实际测试表现却让人大跌眼镜。发布后，一些媒体测试了最新的 Beta 版 Grok 3，并提出了那个经典的用来刁难大模型的问题：“9.11 与 9.9 哪个大？”遗憾的是，号称目前最聪明的 Grok 3，仍然无法正确回答这个问题，被网友戏称为“天才不愿意回答简单问题”。

此外，在 xAI 发布会直播中，在分析游戏《流放之路 2》的职业与升华效果时，Grok3 也给出了大量错误答案，并且马斯克也没有看出这些明显的错误。

尽管在官方 PPT 中，Grok3 在大模型竞技场 Chatbot Arena 中看似“遥遥领先”，但实际上其与 DeepSeek R1 和 GPT4.0 的差距仅为 1% 到 2%。

马斯克在发布会上透露，Grok 3 使用了超过 20 万张 H100 芯片，总训练小时数达到两亿小时。作为对比，DeepSeek V3 仅使用 2000 张 H800 芯片训练两个月，其性能却与 Grok 3 相差无几。这表明，随着模型规模的不断扩大，性能提升的边际效应已经显现。

值得一提的是，马斯克在社交媒体上表示，当前的 Grok 3 仅是测试版，完整版将在未来几个月推出，并邀请用户反馈使用问题。

文章版权声明：除非注明，否则均为超人手游网原创文章，转载或复制请以超链接形式并注明出处。

《言教授要撞坏了》：为何这部荒诞幽默的小说能让人又笑又思考？

相关阅读

号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

《言教授要撞坏了》：为何这部荒诞幽默的小说能让人又笑又思考？

拗的含义及在日常生活中的应用与文化背景

DNF手游闪光节活动预告闪光节活动安排一览

如何提升玩具体验馆的吸引力与教育价值：玩具体验馆改造与调整的成功案例

拷贝漫画APP官方版下载：畅享海量正版漫画内容的最佳平台

YSL蜜桃色WWW是什么？为什么它在化妆界如此受欢迎：一款适合日常和晚宴的完美色号

《流浪地球 2》神预言：人工智能首次用于辅助 2025 年空军招飞定选

发表评论取消回复

快捷回复：表情：

Addoil

Applause

Badlaugh

Bomb

Coffee

Fabulous

Facepalm

Feces

Frown

Heyha

Insidious

KeepFighting

NoProb

PigHead

Shocked

Sinistersmile

Slap

Sweat

Tolaugh

Watermelon

Witty

Wow

Yeah

Yellowdog

评论列表（暂无评论，413人围观）

还没有评论，来说两句吧...

目录[+]