OpenAI の GPT-4o モデルは、混乱してしまうため、ノイズの多い背景でユーザーの音声をエミュレートしますが、問題は…

知っておくべきこと
- OpenAI は最近、一部の ChatGPT Plus 加入者向けに高度な音声モード機能をリリースし、フィードバックを収集してユーザー エクスペリエンスを向上させました。
- ChatGPT の開発元は最近、GPT-4o のパフォーマンスに影響を与える観察されたリスクと、プライバシーとセキュリティの懸念に対処するために使用している緩和策を強調したブログ記事を公開しました。
- OpenAIの安全性とスーパーアライメントチームからトップ幹部が大量に抜ける中、同社は派手な製品を後回しにして、安全性を再び最優先事項にしたようだ。
OpenAIのGPT-4oが5月にリリースされたことで、ChatGPTのモバイルにおける収益とダウンロード数は過去最大を記録し、7月には2,800万ドルの収益を達成し、好調を維持しています。特にChatGPTの開発元が待望の高度な音声モード機能をリリースしたことで、これらの数字はさらに改善する可能性があります。
OpenAIはリリース時に、設定されたしきい値とセキュリティ基準を満たすことを確実にするため、この機能のリリースを1か月延期することを発表していました。なお、この機能は現在、一部のChatGPTユーザーに限定されており、20ドルのPlusサブスクリプションの枠内に隠れています。OpenAIによると、この機能を少数のユーザーに限定しているのは、フィードバックを集め、機能を拡張するためです。
ChatGPTの開発元であるOpenAIは最近、同社のAdvanced Voice Modeが直面している安全上の課題と、その問題を軽減するために講じている綿密な対策を取り上げた新しいブログ記事を公開しました。Advanced Voice Modeを用いた不正な音声生成は、OpenAIにとって大きな懸念事項です。同社によると、このモデルは「事前に選択された音声」に制限されています。また、出力分類器を活用し、モデルが軌道から外れた際に検出する予定です。
問題はあるが、OpenAIはそれに取り組んでいる
OpenAIは、GPT-4oが軌道から外れ、想定外の動作をする可能性があることを認めています。例えば、同社によると、このモデルは騒音環境下ではユーザーの音声を模倣してしまうとのことです。さらに、この奇妙な現象は、背景ノイズの影響でモデルがプロンプトの理解に苦労することで発生すると指摘しています。
注目すべきは、この問題がもはやモデルを悩ませるものではないということです。OpenAIの広報担当者はTechCrunchの取材に対し、同社がこの問題の再発を防ぐため、GPT-4oに「システムレベルの緩和策」を追加したと述べました。
もう一つの顕著な問題は話者識別であり、これはAIの安全性とプライバシーの問題に関係する。OpenAIによると、このモデルは音声出力の音声に基づいて人物を識別するという要求を拒否するように訓練されているという。しかし、有名な名言に関連する人物は識別できる。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
GPT-4oの音声モダリティを考慮するために、音声会話で機能するように特定のテキストベースのフィルターを更新し、音楽を含む出力を検出してブロックするフィルターを構築し、ChatGPTの高度な音声モードの限定アルファ版では、モデルにまったく歌わないように指示しました。
OpenAIやMicrosoftのような企業にとって、安全性は最優先事項になりつつあるようです。主力AIモデルに影響を及ぼす重大な問題に対処した上で、広く利用可能になる前に対処しているのが興味深いところです。こうした問題は、プライバシーと安全性に関する重大な問題につながる可能性があります。
🔥今最もホットなトレンドのセール🔥
- 🎮 Seagate Xbox Series X|S カード (2TB) | Best Buy で 249.99 ドル (110 ドルお得!)
- 🕹️Xbox Game Pass Ultimate (3 か月) | CDKeys で $29.19 ($21 お得!)
- 🎮Lenovo Legion Go (Z1 Extreme、512GB) | Best Buy で 599.99 ドル (100 ドルお得!)
- 💻HP Victus 15.6 ノートパソコン (RTX 4050) | Walmart で 599 ドル (380 ドルお得!)
- 📺Amazon Fire TV Xbox Game Pass バンドル | Amazon で $82.85 ($37 お得!)
- ⌨️Surface Pro キーボード + スリムペン 2 | Best Buy で $112.99 ($167 お得!)
- 🕹️Xbox Game Pass Core (12 か月) | CDKeys で $41.89 ($18 お得!)
- 💻Lenovo Yoga 7i 16 (Core i5) | Lenovo で $774.99 ($365 お得!)
- 🖱️Razer DeathAdder V3 有線マウス | Best Buy で $50.99 ($19 お得!)
- 💻HP OMEN Transcend 14 (RTX 4050) | HP で 1,199.99 ドル (400 ドルお得!)
- 🖱️Razer Basilisk V3 有線マウス | Best Buy で 49.99 ドル(20 ドルお得!)
- 🖥️Lenovo ThinkStation P3 (Core i5 vPro) | Lenovo で $879.00 ($880 お得!)
- ⌨️Alienware Pro ワイヤレス ゲーミング キーボード | Dell で 149.99 ドル (50 ドルお得!)
- 🖱️Alienware Pro ワイヤレス ゲーミング マウス | Dell で 119.99 ドル (30 ドルお得!)
- 🕹️No Man's Sky (PC、Steam) | CDKeys で $24.09 ($36 お得!)
- 💻Dell XPS 13 (Snapdragon X Elite) | Dellで1,099.99ドル (200ドルお得!)
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。