Bitget App
スマートな取引を実現
暗号資産を購入市場取引先物コピートレードBotsBitget Earn
OpenAIの従業員がxAIの最新AIモデルGrok3のベンチマークテスト結果を誤解を招くものだと公に非難

OpenAIの従業員がxAIの最新AIモデルGrok3のベンチマークテスト結果を誤解を招くものだと公に非難

オリジナルを見る
Bitget2025/02/23 03:37

最近、OpenAIの従業員が、Elon MuskのxAI社が最新のAIモデルGrok3のベンチマークテスト結果を誤解を招く形で公開したと公に非難しました。これに対し、xAIの共同創設者であるIgor Babushkinは、不正行為はなかったと主張しました。

xAIのチャートでは、Grok3の2つのバージョン - Grok3 Reasoning BetaとGrok3 mini Reasoning - が、AIME 2025においてOpenAIの現在最強のモデルであるo3-mini-highを上回ったと示されています。しかし、OpenAIの従業員はすぐにプラットフォームXで、xAIのチャートにはAIME 2025の「cons@64」条件下でのo3-mini-highのスコアが含まれていないと指摘しました。

プラットフォームXで、Babushkinは、OpenAIも過去に同様の誤解を招くベンチマークチャートを公開していたと主張しました。これらのチャートは、自社のモデル性能を比較するために使用されていました。

0

免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット
最大12%のAPR!エアドロップを継続的に獲得しましょう!
今すぐロック