ChatGPTの音声モードは予定通りにはリリースされない ― スカーレット・ヨハンソンからの発表はまだない

  • abmhh
  • 0 comments
ChatGPTの音声モードは予定通りにはリリースされない ― スカーレット・ヨハンソンからの発表はまだない
OpenAIとChatGPT
OpenAIは、ChatGPTの音声モードを改良するにはさらに1か月必要だと述べています。 (画像提供:ダニエル・ルビーノ)

知っておくべきこと

  • OpenAI は今年初め、自然言語による口頭コミュニケーションをサポートする ChatGPT の音声モードを実演しました。
  • 音声モードは今月、選ばれたテスト担当者グループに展開される予定でしたが、延期されました。
  • OpenAIは、「特定のコンテンツを検知して拒否するモデルの能力」を向上させる必要があると説明した。
  • 同社はまた、音声モードのユーザーエクスペリエンスを向上させ、予想される需要の規模に対応できるインフラストラクチャを整備することを目指しています。
  • OpenAIは、Voice Modeの「Sky」の声は彼女をモデルにしたと主張するスカーレット・ヨハンソンから批判を受けたが、OpenAIはVoice Modeの延期を発表した際にその法廷闘争については言及しなかった。

OpenAIのChatGPT向け音声モードを試すには、少なくともあと1ヶ月は待たなければなりません。先月、OpenAIは音声ベースの体験をデモしました。この体験では、自然言語を使ってChatGPTとコミュニケーションを取ることができます。同社は今月、ChatGPT Plusの少数のユーザーを対象に音声モードのテストを開始する予定でしたが、その後、ロールアウトが延期されました。

OpenAIは、この延期により「特定のコンテンツを検知・拒否するモデルの能力」を向上させるための時間を確保できると発表した。拒否すべきコンテンツの種類は具体的には明らかにされていないが、ユーザーがChatGPTをバーチャルガールフレンドのように機能させようとするのではないかとの憶測も一部で飛び交っている。もしそうであれば、OpenAIは音声モードの機能を明確に設定する必要があるだろう。

この延期により、OpenAI は Voice Mode のユーザー エクスペリエンスを改善し、需要に対応できるインフラストラクチャを準備する機会も得られます。

OpenAIはX(旧Twitter)で次のような声明を発表しました。

「春のアップデートでデモを行った高度な音声モードのアップデートをお知らせします。私たちはこれに非常に興奮しています。

ChatGPT Plusユーザーの一部を対象に、6月下旬にアルファ版の展開を開始する予定でしたが、リリース目標達成まであと1ヶ月となりました。例えば、特定のコンテンツを検知して拒否するモデルの能力向上に取り組んでいます。また、ユーザーエクスペリエンスの向上と、リアルタイム応答を維持しながら数百万人規模への拡張に対応できるインフラストラクチャの準備にも取り組んでいます。

段階的な展開戦略の一環として、まずは少数のユーザーを対象にアルファ版をリリースし、フィードバックを収集し、得られた知見に基づいて拡張していきます。秋にはPlusユーザーの皆様にもご利用いただけるようになる予定です。具体的なスケジュールは、高い安全性と信頼性の基準を満たすかどうかによって決まります。また、別途デモを行った新しいビデオ機能と画面共有機能の展開にも取り組んでおり、今後のスケジュールについては改めてお知らせいたします。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

ChatGPTの高度な音声モードは、感情や非言語的な合図を理解し、それに応じて応答できるため、AIとのリアルタイムで自然な会話に近づきます。私たちの使命は、こうした新しい体験を皆様に思慮深くお届けすることです。

続きを読む

OpenAIは声明の中でスカーレット・ヨハンソン氏について言及しなかった。彼女はOpenAIがChatGPTの「スカイ」の声をヨハンソン氏に似せていると非難した。具体的には、その声がNetflix映画「her/世界でひとつの彼女」のヨハンソン氏演じるキャラクターの声に似ているとされた。ヨハンソン氏が声明を発表した直後、OpenAIは音声技術を撤回した。

その後、OpenAIのCEOサム・アルトマン氏は、これらの疑惑に対し、「スカイはスカーレット・ヨハンソンのものではありませんし、彼女に似せようとしたこともありません。ヨハンソン氏に働きかける前に、スカイの声を担当する声優を起用しました。ヨハンソン氏への敬意を表し、当社の製品におけるスカイの声の使用を一時停止しました。ヨハンソン氏には、より適切なコミュニケーションが取れなかったことをお詫び申し上げます」と反論した。

ChatGPTの音声モードの遅延がOpenAIとヨハンソン氏の間の潜在的な法廷闘争に関係しているかどうかに関わらず、テスターは音声技術を試すために少なくとも来月まで待たなければならないだろう。

ショーン・エンディコットはWindows Centralのテクノロジージャーナリストで、Windows、Microsoftソフトウェア、AI、PCを専門としています。Windows 10と11からChatGPTのようなAIツールの台頭まで、主要なリリースを取材してきました。ショーンのキャリアはLumia 930から始まり、アプリ開発者との強いつながりを築きました。執筆活動以外では、アメリカンフットボールのコーチも務めており、チームの運営にMicrosoftのサービスを活用しています。ノッティンガム・トレント大学で放送ジャーナリズムを学び、X(@SeanEndicott_)とThreads(@sean_endicott_)で活躍しています。