馬斯克所言不虛！Grok 3 測試結果出爐，各方面皆吊打其他 AI 模型

Bitget App

交易「智」變

Bitget

資訊中心

Zombit2025/02/18 20:55

作者:zombit jeff

Table of Contents

Toggle

Grok 3 完勝對手
馬斯克所言不虛？
實際產品恐令人失望

Grok 3 完勝對手

根據知名 AI 模型排名開源平台 lmarena.ai 的最新測試數據顯示，xAI 早期版本的 Grok 3（代號「chocolate」）在 Arena 排行榜上排名第一。

BREAKING: @xAI early version of Grok-3 (codename "chocolate") is now #1 in Arena! 🏆

Grok-3 is:
– First-ever model to break 1400 score!
– #1 across all categories, a milestone that keeps getting harder to achieve

Huge congratulations to @xAI on this milestone! View thread 🧵… https://t.co/p8z8lccNd5 pic.twitter.com/hShGy8ZN1o
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) February 18, 2025

在這次測試結果中，Grok-3 創下多項紀錄，其中包括成為史上首個突破 1400 分的語言模型，並在數學、創意寫作、多輪對話、編程等測試類別中全數拿下第一名。

使用者可以在此網站參與模型的測試，並投票選擇哪一個模型更為優秀。

馬斯克所言不虛？

根據 Zombit 此前報導，馬斯克在《世界政府高峰會》的活動上發表演說時透露，Grok 3 將在幾週內問世，並自信的表示 Grok 3 將超越迄今為止所有其他人工智慧模型。其在演講中說道：

「有時我覺得Grok 3 聰明得可怕…我們正處於打磨 Grok 3 的最後階段，可能會在一兩週內發布，所以很快就來了。」

如今從測試結果來看，馬斯克似乎並不是「老馬賣『Grok』，自賣自誇」。

實際產品恐令人失望

然而，儘管 Grok 3 在測試結果表現突出，但實際相用戶推出的似乎不會是完整版本，而是被削弱的閹割版。知名開發者 banteg 指出，Grok 3 已經向部分用戶推出，但似乎與他們展示的版本有所不同，其在推文中表示：

「DeepSearch 只執行一次搜尋 + 推理，並且削弱後甚至無法搜尋 X 上的貼文。」

grok 3 rolled out to x users, but it seems different from what they've demoed. deepsearch is just one search + inference and it downgraded so it can't even search x posts. pic.twitter.com/N2RuigjPai
— banteg (@bantg) February 18, 2025

免責聲明：文章中的所有內容僅代表作者的觀點，與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX：鎖倉獲得新代幣空投

不要錯過熱門新幣，且APR 高達 10%+

立即參與

您也可能喜歡

【狂人說趨勢】近 1 、 2 個月能橫住就是最好的走勢

Blockcast•2025/04/18 11:55

「數位黃金」失靈？摩根大通：避險資金獨愛黃金、冷落比特幣

Blockcast•2025/04/18 11:55

加密幣市場 Q1 遇寒流：DeFi TVL 蒸發 489 億美元、比特幣寫 7 年最慘開局　

Blockcast•2025/04/18 11:55

The Daily: 美聯儲主席暗示可能放寬銀行加密貨幣規則，特朗普稱鮑威爾的解僱“迫在眉睫”及更多

快速概覽美國聯邦儲備委員會主席Jerome Powell在週三於芝加哥經濟俱樂部表示，美國銀行監管機構可能會放寬加密貨幣相關的限制。由Coinbase支持的以太坊Layer 2區塊鏈項目Base在公然推廣“Base is for everyone”代幣後引發社區反彈，該代幣在發佈數小時內一度暴跌95%，後來恢復。

The Block•2025/04/18 10:45