Microsoft Copilot が他の AI LLM と直接 IQ テストでどのように競い合ったかをご覧ください 🧠

すべての脳が同じように作られているわけではなく、それは人工知能にも当てはまります。
Apple から Meta に至るまで、大手テクノロジー企業が AI ブームで利益を上げる方法を必死に模索する中、私たちがよく知るある企業が、あまり注目を浴びないところで陰謀を企て続けています。
MetaがOpenAIの研究者を引き抜くために数千万ドルのボーナスを支払っていると報じられ、Appleが自社のAIへの取り組みについて明確な計画を持たずに株主を不安にさせている一方で、Microsoftはこうしたサービスの多くにバックエンドの電力を供給することに比較的満足しているようだ。
実際、マイクロソフトは他の企業の AI 強化に大きく賭けており、2025 年を通じて 15,000 人以上の従業員を大量に解雇し、Azure 向けの AI に特化した新しいデータ センターに多額の資金を投じる計画だと報じられています。
もちろん、Microsoftも自社開発のAI開発に取り組んでいます。例えば、Microsoft CopilotはChatGPTなどのAIアシスタントアプリに対するMicrosoftの回答です。Microsoftはフォトアプリ、Microsoftペイント、さらにはメモ帳にも「AI」機能を組み込んでいます。しかし、今のところ、関心を持つ人はほとんどいないようです。そして、これが少なくとも部分的には理由かもしれません。
最近、TrackingAIというウェブサイトを見つけました。これは、様々なIQ関連の課題で様々なモデルを比較するサイトです。このウェブサイトでは、AI LLM(法学修士)を対象に、メンサ・ノルウェーの難解な推論テストと、AIがWebサーフィンで解答を探すのを防ぐよう設計された完全オフラインテストの両方を実施しています。Microsoft Copilotの成績はどうだったでしょうか?まあ…特に良いとは言えません(少なくとも紙面上では)。
オフラインテストでは、Microsoft Copilot はスコア 67 で最下位に沈みました。比較すると、OpenAI o3 Pro が現在トップに立ち、117 を獲得しています。Copilot は Mensa Norway テストでやや良い成績を収め、84 を獲得しました。Elon Musk の Grok-4 が Mensa Norway テストで優勝し、136 を獲得しました。OpenAI o3 Pro は 135 でそれに続きました。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
しかし、それは本当に重要なのでしょうか?Microsoft Copilotは、推論よりも汎用性、速度、費用対効果を優先するGPT-4oに基づいている点に留意する必要があります。OpenAIのo3モデルは、GPT-4oよりも実行コストが数倍高いため、一般公開されていません。Microsoft Copilotを上回るモデルのほとんどは、一般的に実行コストが高い「プロ向け」モデルです。Copilotは無料であり、そのパフォーマンスは概ねそのことを反映しています。
マイクロソフトの中核研究分野の一つは、より強力なモデルをよりコスト効率の高いものにする方法を模索することです。マイクロソフト自身も、AIの電力消費にほぼ起因する二酸化炭素排出量の急増を報告しています。マイクロソフト独自のPhiモデルも、それほど広く利用可能ではありませんが、いわゆるSmall Language Models(SML)としてパフォーマンスを重視しており、デバイス上で動作し、最小限のコストで実行できるように設計されている可能性があります。残念ながら、私が知る限り、PhiモデルはまだTrackingAIに掲載されていません。
これらのテストの現実は、少なくとも現時点では、各言語モデルが特定のタスク向けにカスタマイズされていることです。GPT-4oとCopilotは、学術的な用途では劣るものの、より消費者に優しく、あえて言えば「楽しく」使えるように設計されています。Copilotには、サブスクリプションに加入すれば精度を高める詳細な研究モードがあります。
AI分野は現在、Google Gemini、XのGrok、OpenAIのChatGPTといった企業が特定のパラメータで互いに競い合うなど、大きな盛り上がりを見せています。Microsoft自身も、多大な投資を行っているにもかかわらず、この話題にほとんど登場していないのは、少し残念なことです。Copilot+ PCの失敗やWindows Recallによるプライバシー侵害への反発といった、ネガティブな意味での話題を除けば。
おそらくマイクロソフトは、脚光を浴びるのではなく、裏方に徹し、Azure で未来を牽引することに満足しているだけなのでしょう。
ジェズ・コーデンはWindows Centralのエグゼクティブエディターで、Xboxとゲーム関連のニュースを中心に取り上げています。ジェズは、お茶を飲みながら、Microsoftエコシステムに関する独占ニュースや分析を発信することで知られています。Twitter(X)でフォローして、XB2ポッドキャストもお聴きください。その名の通り、Xboxに関するポッドキャストです!