OpenAI の CEO サム・アルトマン氏の「魔法の」 GPT-4o は、Microsoft Copilot の定期的なアップデートと…を組み合わせたような感じでした。

  • abmhh
  • 0 comments
OpenAI の CEO サム・アルトマン氏の「魔法の」 GPT-4o は、Microsoft Copilot の定期的なアップデートと…を組み合わせたような感じでした。
サム・アルトマン
(画像提供:ブルームバーグ、ゲッティイメージズ経由)

ここ数週間、OpenAIが先日終了したばかりの春のアップデートイベントについて、様々な憶測や噂が飛び交っていました。正直なところ、ChatGPTの開発者は普段は情報を秘密にしておくのが得意なので、私たちには何が起こるのかを予測することは不可能でした。 

つまり、GoogleやBingと競合するAI搭載検索エンジンや、「せいぜい少し恥ずかしい」GPT-4モデルの後継となるGPT-5は登場しなかったのです。以前、OpenAIのCEOであるサム・アルトマン氏は、GPT-4は「ちょっとひどい」と認め、「今後使うことになるモデルの中で最も愚かなモデル」だと断言しました。OpenAIの幹部は先週、この見解を繰り返し、現在のChatGPTは今後12ヶ月で「笑ってしまうほどひどい」ものになるだろうと述べました。

週末、サム・アルトマンは自身のX(旧Twitter)アカウントで事実関係を明らかにした。曖昧な表現ではあったものの、アルトマンは同社が懸命に開発を進めており、彼にとって「魔法のように感じられる」新製品のリリースに向けて準備を進めていることを認めた。さらに、ユーザーもきっと気に入ってくれるだろうと付け加えた。 

GPT-4o は本当に魔法のようなものですか?

OpenAIが先日終了したイベントで最も興味深いのは、おそらく新しいGPT-4oモデルでしょう。ただし、魔法のような部分についてはよく分かりません。この主力モデルは、音声、画像、テキストをリアルタイムで推論できるため、ChatGPTとのインタラクションがより直感的になります。 

ChatGPTのメーカーが新しいフラッグシップモデルを発表して以来、私はたくさんのデモを見てきました。誤解しないでください。確かに素晴らしいですが、デビュー前に期待されていたほど魔法のような画期的なものではありません。GPT-4oは、イベント前の期待に応えるものではありませんでした。

リアルタイム翻訳機能は非常に興味深く、便利だと感じましたが、既に実用化されています。OpenAIの春のアップデートで行われたGPT-4oのライブ翻訳デモは、SamsungのフラッグシップモデルS24に搭載されているLive Translate機能を彷彿とさせます。これは、スマートフォンに組み込まれたパーソナル翻訳機能で、リアルタイムの多言語コミュニケーションを促進します。

そのため、ユーザーは相手の言語を知らなくても、話せなくても、誰とでもコミュニケーションを取り、正確な返答を伝えることができます。さらに、この機能はライブチャットインターフェースを表示し、通話中に伝えられる情報をリアルタイムで翻訳します。また、応答も発信者の言語に翻訳されるため、効率的かつ効果的なコミュニケーションが可能になります。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

GPT-4o のリリースはまだ初期段階にありますが、新しいアップデートや機能によって、それほど遠くない将来にさらに改善され、さらには「魔法のように」進化する可能性があります。 

独占macOSアプリがマイクロソフトとOpenAIの複雑な提携にさらなる問題を引き起こす

ChatGPTのプライバシー設定

(画像提供:Future)

イベント前にOpenAIについて話をして、同社がどのような発表をする可能性があるか推測しました。最初の予想は、同社がGPT-4モデルをChatGPTの無料ユーザーを含むすべての人に公開するだろうということでした。 

さらに、AIサービスを広く誰もが無料で利用できるようにすることは、創業時の使命の一部です。ご存知の通り、億万長者のイーロン・マスク氏は、OpenAIとそのCEOサム・アルトマン氏を、同社の創業時の使命に対する「明らかな裏切り」として訴訟を起こしました。アルトマン氏はさらに、この注目のスタートアップは今やクローズドソースの、事実上のマイクロソフトの子会社になっていると付け加えました。Microsoft Insiderも同様の意見を共有しているようで、レドモンドの巨大企業は、この注目のスタートアップの誇張されたIT部門に過ぎないと以前から指摘しています。

これは皮肉なことです。OpenAIがChatGPTアプリをMacユーザー向けにリリースすると発表した後ではなおさらです。MicrosoftがOpenAIとその技術に数十億ドルを投資していたことを考えると、このような状況ではMicrosoftが助っ人的な立場を確保できたはずです。OpenAIは、ユーザーがWindowsよりもMacを優先していると述べています。 

マイクロソフトとOpenAIのパートナーシップは非常に複雑で、マイクロソフトがOpenAIの営利部門の収益の49%を保有しているにもかかわらず、ここ数ヶ月は何度もやり取りを続けています。興味深いことに、マイクロソフトのCEOであるサティア・ナデラ氏は、初期の支援がなければOpenAIは存在しなかったと公然と認めており、さらに次のように述べています。

「私たちは自分たちの能力に非常に自信を持っていました。知的財産権も能力もすべて保有しています。もし明日OpenAIが消滅したとしても、正直言って、お客様には心配していただきたくありません。なぜなら、私たちは製品を提供するだけでなく、イノベーションを継続する権利をすべて保有しているからです。しかし、パートナーシップで行っていたことを、自分たちだけで実行できるのです。つまり、人材、コンピューティング能力、データ、すべてを備えているのです。」

MicrosoftのWindows 11には、ChatGPTと同じ技術を搭載したCopilotが既に搭載されています。ご存知ない方のためにお知らせすると、Microsoftは今年初めに、OpenAIのGPT-4モデルとDALL-E 3画像生成技術に対応したモバイルユーザー向けのCopilotアプリをリリースしました。 

ChatGPT と Microsoft ロゴ

(画像提供:ダニエル・ルビーノ)

興味深いことに、OpenAIはこれらの機能を20ドルのChatGPT Plusサブスクリプションに組み込んでいるのに対し、MicrosoftはiOSとAndroid向けの新しいアプリを通じて誰でも無料で利用できるようにしている。しかし、Appfiguresのレポートによると、OpenAIは依然としてモバイル市場を席巻している。

OpenAIがネイティブChatGPTアプリをWindowsユーザーにいつリリースする予定かは不明ですが、近いうちにリリースされる可能性が高いでしょう。また、Microsoftが新しいGPT-4oモデルをCopilot AIに統合する可能性もあります。

OpenAIがWindows 11を無視し、Macユーザー向けにネイティブChatGPTを発表したことで、ソーシャルメディア上で激しい議論が巻き起こっています。Xでこの話題を取り上げた記事への懸念を抱くユーザーからのコメントを見ると、Windows側ではMicrosoftが主導権を握る可能性が高いため、OpenAIがMacユーザー向けのネイティブアプリを開発したのではないかと考えている人もいるようです。別のユーザーは、「まあ…Microsoftは数日以内にCopilotでGPT-4oを搭載するでしょう。OpenAIはGoogle Geminiに先んじてMacとiPhoneに参入したいのでしょう。結局、AzureでMicrosoftが勝利するでしょう。Microsoftは現在、Azureで収益の大部分を稼いでいます。」と述べています。

私の意見では、このイベントは、マイクロソフトが Microsoft Copilot (旧称 Bing Chat) をリリースしたばかりで、サービスに提供される新しい更新情報や機能を紹介するブログ記事を毎週公開していた 2023 年の初め頃のように感じられました。 

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。