「イーロン・マスクはGrok 3が史上最も賢いAIになると約束した。しかし、ネタバレ注意:そうではなかった。」— AI評論家…

xAIのGrok 3は、大きな期待と期待の高まりを受け、ついに次世代AIとして出荷されました。同社のCEOで億万長者のイーロン・マスク氏は、これを「地球上で最も賢いAI」と称賛し、数学、科学、コーディングなど幅広いベンチマークにおいて、OpenAI、Anthropic、DeepSeek、GoogleといったトップAI企業の独自モデルを凌駕したと主張しました。
Grok 3のパフォーマンス向上は、マスク氏が「Grok 3は前世代機の10倍の演算能力を備えている」と述べたことに起因していると考えられる。X(旧Twitter)での製品発表の際に、イーロン・マスク氏は次のように述べた。
「Grok 3はGrok 2よりも桁違いに能力が優れています...たとえその真実が政治的に正しいことと矛盾する場合でも、最大限に真実を追求するAIです。」
「私たちは毎日モデルを継続的に改良しており、文字通り24時間以内に改善が見られるでしょう」とマスク氏は付け加えた。興味深いことに、Grok 3は、AIMEテスト(モデルの数学的能力を評価する)やGPQA(モデルの科学的な能力を評価する)など、複数のベンチマークでOpenAIのGPT-4oを上回っている。
しかし、OpenAIの共同設立者であり、元Tesla AIリーダーのAndrej Karpathy氏は、Grok 3のパフォーマンスに関する興味深い洞察を共有しました。
今朝約2時間かけてざっと触ってみた限りでは、Grok 3 + ThinkingはOpenAIの最強モデル(o1-pro、月額200ドル)の最先端領域にほぼ匹敵し、DeepSeek-R1やGemini 2.0 Flash Thinkingよりもわずかに優れているように感じます。チームが約1年前にゼロからスタートしたことを考えると、これは非常に驚くべきことです。最先端領域に到達するまでのこのタイムスケールは前例のないものです。ただし、注意点も念頭に置いてください。モデルは確率的であり、毎回わずかに異なる答えを出す可能性があります。また、まだ初期段階であるため、今後数日/数週間にわたってさらに多くの評価を待つ必要があります。LMアリーナの初期結果は非常に有望です。今のところ、xAIチームに心からお祝い申し上げます。彼らは明らかに大きな速度と勢いを持っており、Grok 3を私の「LLM評議会」に追加し、今後の彼らの意見を聞くのが楽しみです。
本日、Grok 3 の早期アクセスが付与されたため、ちょっとした雰囲気チェックを試せる最初の数人のうちの一人になったと思います。思考✅ まず、Grok 3 には最先端の思考モデル(「考える」ボタン)が搭載されており、私の「カタンの開拓者たち」では箱から出してすぐに素晴らしい結果が出ました… pic.twitter.com/qIrUAN1IfD 2025年2月18日
Grok 3について知っておくべきことすべて
20 万台の GPU を備えた xAI のメンフィス データ センターを使用してトレーニングされた Grok 3 は、さまざまな AI モデルを比較するために設計されたクラウドソーシング テストである Chatbot Arena で競合他社よりも高い評価を獲得しました。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
Grok 3には、ThinkモードとBig Brainモードの2つのモードが搭載されています。前者は一般的なクエリに使用でき、後者はより多くの計算リソースにアクセスしてより深い推論を行うため、複雑なクエリを処理できます。
xAIによると、Grok 3 ReasoningとGrok 3 mini Reasoningは、OpenAIのo3-miniやDeepSeekのR1 AIと同様に、問題を思考・推論することができます。また、このツールには、クエリへの応答時に、より優れたリサーチ、ブレインストーミング、データ分析を可能にする新しいDeepSearch機能が搭載されており、OpenAIのDeep SearchやPerplexity DeepResearchに匹敵します。
Grok 3はすでにPremium+プランに加入しているXユーザー向けにリリースされています。xAIは、DeepSearchへの独占アクセス、より優れた推論機能、無制限の画像生成機能などを含む「SuperGrok」という新しいサブスクリプションプランを発表する予定であることは注目に値します。
そのため、イーロン・マスクは今後数か月以内に Grok 2 をオープンソース化することを計画しています。
「私たちの基本的なアプローチは、次のバージョンが完全にリリースされたら、Grokの最新バージョンをオープンソース化することです。Grok 3が成熟し安定したら、おそらく数ヶ月以内にGrok 2をオープンソース化する予定です。」
興味深いことに、ペンシルバニア大学ウォートン校の准教授であるイーサン・モリック氏は、マスク氏の主張にもかかわらず、Grok 3 は AI 分野のリーダーではないと指摘している。
- Xはリリース済みのモデルのフロンティアに非常に早く追いついており、このペースでスケールアップを続ければ、彼らは主要プレーヤーとなるでしょう。とはいえ、彼らのベースモデルは現在チャットボット分野でトップを走っていますが、ベンチマークではOpenAIのo3を明確に上回っているわけではありません。
- Grok 3はOpenAIのプレイブックに忠実に従っており、同じ製品ミックスを使用している。
- 現時点で企業が Grok API を使用するかどうかはわかりませんが、エンタープライズ パートナーシップ (Azure、AWS など)、サポート、および他の大規模なラボに対する広範な販売とトレーニングの取り組みを考えると、Grok に大きなチャンスがあるかどうかはわかりません。
Grok 3 の OpenAI o3 に対するパフォーマンスは依然として議論の余地がありますが、Geometric Intelligence の創設者である Gary Marcus 氏は次のように述べています (Business Insider 経由)。
「イーロン・マスクは、Grok 3が史上最も賢いAIになると約束しました。ネタバレ注意:そうではありませんでした。」
マーカス氏は、Grok 3のローンチを以前のデモの「コピー」だと評した。同氏は、このモデルは大きな可能性を秘めているものの、そのパフォーマンスはOpenAIのモデルにはまだ及ばないと付け加えた。「サム・アルトマン氏は今のところ安心できるだろう」と付け加えた。「大きな飛躍はない」
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。