NVIDIA CEO は AI のせいでコーディングが廃れつつあると正しく指摘しているかもしれない — OpenAI の新しい CriticGPT モデルは…
知っておくべきこと
- OpenAI は最近、ChatGPT を使用して生成されたコードのエラーを識別するために CriticGPT をリリースしました。
- このツールは、AI トレーナーが AI の助けを借りずに通常行うよりも迅速かつ容易にエラーを特定するのに役立ちます。
- ChatGPT の開発者は、このツールが 100% 正確ではないことを認めており、非常に複雑なタスクを処理できないことや、定期的に幻覚が発生することなど、いくつかの課題に直面している。
OpenAIは最近、GPT-4を搭載したCriticGPTをリリースしました。その名前が示すように、このモデルは「ChatGPTの応答に対する批評を書き、人間のトレーナーがChatGPTのコード出力の誤りを見つけるのを支援します」。
ChatGPT のメーカーによると:
ChatGPTコードのレビューにCriticGPTの支援を受けた人は、支援を受けていない人よりも60%高いパフォーマンスを発揮することがわかりました。現在、CriticGPTのようなモデルをRLHFラベリングパイプラインに統合し、トレーナーに明確なAI支援を提供するための作業を開始しています。
OpenAIは、人間からのフィードバックによる強化学習(RLHF)を活用して、ChatGPTをより「有益でインタラクティブ」なものにすることを計画しています。このプロセスの不可欠な部分として、AIトレーナーからの比較データの収集が挙げられます。これは、AIトレーナーがChatGPTの異なる応答を互いにどのように評価するかに基づいています。
CriticGPTはChatGPTの推論能力の向上に役立ち、最終的には幻覚や誤った応答、誤情報の生成を減らすことができます。しかしながら、ChatGPTの進化に伴い、AIトレーナーが誤りを特定することがますます困難になっています。
このツールは主に、ChatGPTの回答における不正確な点を特定し、それを指摘する批評を書くように訓練されています。OpenAIは、このツールが常に100%正確であるとは限らないことを認めていますが、AIトレーナーがAIなしで通常行うよりも迅速かつ容易にエラーを特定するのに役立ちます。
CriticGPTはスキルを増強し、最終的にはより包括的な批評技術を人々に身につけさせると報告されています。AIトレーナーとCriticGPTは別々に作業を行うこともできますが、正確で詳細な批評を提供する場合、人間とCriticGPTの組み合わせが人気があり、徹底的な成果を上げているようです。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
OpenAIの調査結果によると:
「自然発生的なバグに関しては、トレーナーが ChatGPT 批評よりも CriticGPT 批評を好むケースが 63% ありました。これは、新しい批評家の方が「nitpicks」(役に立たない小さな苦情)が少なく、問題を幻覚的に捉える頻度も低いためです。」
CriticGPTはまだ開発中です
CriticGPTは素晴らしい成果を上げていますが、まだ多くの改善が必要です。OpenAIは、このモデルの欠点を以下のように指摘しています。
- CriticGPTは、非常に短いChatGPTの回答を用いて学習しました。将来のエージェントを監督するためには、トレーナーが長く複雑なタスクを理解できるような手法を開発する必要があります。
- モデルは依然として幻覚を起こし、トレーナーはそれらの幻覚を見た後にラベル付けの間違いを犯すことがあります。
- 現実世界では、間違いは回答の複数の部分に分散している場合があります。私たちの研究は、一箇所で指摘できる間違いに焦点を当てていますが、将来的には分散した間違いにも取り組む必要があります。
- CriticGPT が役立つことは限られています。タスクまたは応答が非常に複雑な場合は、モデルの支援を受けた専門家であっても正しく評価できない可能性があります。
AIについてさらに詳しく
OpenAIは今後、GPT-4の学習用RLHFデータを改善することで、CriticGPTのさらなる発展を目指しています。別の報告書では、オックスフォード大学の研究者が意味エントロピーを活用して生成された出力の品質と意味を評価し、応答の質を判断し、幻覚の痕跡を発見しました。
AIモデルはますます高度化・洗練化しており、複雑なタスクをより適切に処理できるようになっています。NVIDIAのCEO、ジェンスン・フアン氏は、コーディングは将来の世代にとってキャリアの選択肢として行き詰まっている可能性があると主張しています。OpenAI GPT-4oのコーディング能力を見れば、フアン氏の意見は必ずしも間違っていないかもしれません。彼はむしろ、生物学、教育、製造業、あるいは農業といった分野での代替キャリアの選択肢を探すことを推奨しています。
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。