DeepSeek は、トランプ大統領の 5,000 億ドルの投資後のコストわずか 3% で OpenAI の推論モデルを上回ります…

生成AIの急速な台頭により、この技術をより高いレベルにまで拡張するには膨大なリソースが必要であることが明らかになっています。例えば、OpenAIはChatGPTの運用に1日最大70万ドルを費やしていると報じられています。これは、クエリごとに冷却に必要な膨大な量の水に加えて発生するもので、GPT-4は従来考えられていたよりも最大4倍の水を冷却に消費しており、わずか100語を生成するのに水筒3本分もの水を消費しています。
高度なAIの進歩を促進するには途方もない巨額の資金が必要であり、これが昨年OpenAIが破産を報告した大きな要因となったかもしれない。同社は1年以内に50億ドルの損失を出すと予測されていた。しかし、中国の新興AIスタートアップ企業DeepSeekは、DeepSeek-R1と呼ばれる新たな主力モデルで、この状況を一変させようとしている。このモデルはOpenAIのo1推論モデルと互角に渡り合うことができ、OpenAI、Anthropic、GoogleといったトップAIラボに匹敵する実力を持つ可能性がある。
ご存知の通り、AIの進歩はスケーリング則によって阻害されており、一流のAI研究室がトレーニング用の高品質なコンテンツの不足により高度なモデルの開発を困難にしていると示唆する複数の報告がオンライン上に出回っています。元Google CEOのエリック・シュミット氏とOpenAI CEOのサム・アルトマン氏はこれらの主張を否定し、AIモデルが前例のないほどのスケールアップをすることが予想される中、スケーリング則が施行される兆候はないと示唆しました。「壁などありません」とアルトマン氏は付け加えました。
競合他社の AI モデルと比較して、DeepSeek-R1 が特別な点は何ですか?
ご想像のとおり、R1の以前の比較では、数学、コーディング、推論の分野でOpenAI o1と類似した能力を共有していることが強調されています。AI企業が先週発表した研究論文によると、このモデルの驚異的な推論能力は、純粋強化学習と呼ばれる高度な技術に基づいています。NVIDIAのシニアリサーチマネージャー、ジム・ファン氏は、この技術はGoogle DeepMindがAlphaZeroで採用したアプローチに似ていると主張しています。AlphaZeroは、囲碁やチェスなど、幅広いゲームで「人間のグランドマスターの動きを模倣することなく」その実力を発揮しています(Business Insiderより)。
R1は具体的に何をするのでしょうか?DeepSeekによると、「数学、コード、推論のタスク全体でOpenAI o1に匹敵するパフォーマンス」を実現しています。
興味深いことに、R1はAIME 2024数学ベンチマークで79.8%のスコアを獲得し、OpenAIのo1推論モデルを上回りました。さらに、Codeforcesでは2,029 Eloレーティングを獲得し、コーディングテストでもエキスパートレベルを示し、人間の競技者の96.3%を上回りました。
強化学習は強力で興味深い推論行動を促進し、事前のトレーニングやプログラミングなしでモデルが自己検証や反省などの高度な機能を開発できるようにします。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
私たちは、米国以外の企業がOpenAIの本来の使命、つまり真にオープンで、すべての人に力を与える最先端の研究を守り続けている時代に生きています。全く意味がありません。最も面白い結果こそが最も可能性が高いのです。DeepSeek-R1は、大量のモデルをオープンソース化するだけでなく… pic.twitter.com/M7eZnEmCOY 2025年1月20日
OpenAIの本来の使命、つまり真にオープンで、すべての人に力を与える最先端の研究を、米国以外の企業が守り続けている時代が到来しました。これは全く理にかなっていません。最も面白い結末が、最もあり得るのです。DeepSeek-R1は、大量のモデルをオープンソース化するだけでなく、トレーニングの秘密をすべて公開しています。彼らはおそらく、RLフライホイールの大規模かつ持続的な成長を示す最初のOSSプロジェクトでしょう。「ASIを社内で達成」や「Project Strawberry」のような架空の名称でインパクトを与えることもできますし、生のアルゴリズムやmatplotlibの学習曲線をそのまま公開するだけでも、インパクトを与えることができます。
NVIDIA シニア リサーチ マネージャー、ジム ファン
背景として、DeepSeek-R1はR1-Zeroと呼ばれる以前のモデルをベースにしており、開発に携わったAI研究者たちはこのモデルに「ひらめき」を覚えました。研究者たちは、このAIが「初期のアプローチを再評価することで、問題により多くの思考時間を割り当てることを学習する」と発表しました。ウォートン校のイーサン・モリック教授は、R1の応答は「人間の思考を声に出して表現したもの」に似ていると述べています。
R1の発表は、OpenAIとAnthropicが切望するAGIベンチマークの達成をめぐって熾烈な競争を繰り広げているさなかに行われた。OpenAIのCEO、サム・アルトマン氏は、チームはAGIの構築方法を理解しており、現在のハードウェアでは予想よりも早く達成できると述べた。さらに、AIが人類を滅ぼす確率は99.9%であるにもかかわらず、このベンチマークは驚くほど社会的影響を少なく達成できるだろうと付け加えた。
そのため、DeepSeekのオープンソースモデルは、AI分野における公正な競争を取り戻す可能性を秘めています。OpenAIはo1推論モデルを広く利用可能にしましたが、12月に200ドルの新しいChatGPT Proプランに組み込みました。サム・アルトマン氏は、このモデルの法外な価格設定の理由について、「最も困難な問題に対して、より深く考えることができる」と述べました。
DeepSeek の DL 研究者Deli Chen 氏によると、次のとおりです。
「信じられない結果、夢のようです。私たちのR1モデルが(スタイル制御機能付きで)世界一になりました!🌍🏆 言葉にならないほど嬉しいです。🤯 オープンソースAGIを誰もが利用できるようにするために、私たちはこれからも前進し続けます。🚀」
DeepSeekの新しいr1が、中国共産党が好まないトピックについて質問されると自動的にシャットダウンする面白いデモです⬇️しかし、検閲はモデル自体ではなく、上位レイヤーによって行われていることは明らかです。オープンソース版を実行していて、検閲の有無や程度をテストできる方はいますか? https://t.co/gy0pId9Qw0 2025年1月20日
DeepSeekは、主力AIモデルR1をオープンソース化するだけでなく、その実行コストも莫大なものにしています。同社の調査論文によると、このモデルは100万トークンあたりわずか0.14ドルでクエリを実行しており、OpenAIの高額な7.50ドルを大きく引き離しています。DeepSeekは、O1推論モデルでOpenAIの莫大な努力を、その約3~5%のコストで上回りました。
DeepSeekの新しいr1が、中国共産党が好まないトピックについて質問されると自動的にシャットダウンする面白いデモです⬇️しかし、検閲はモデル自体ではなく、上位レイヤーによって行われていることは明らかです。オープンソース版を実行していて、検閲の有無や程度をテストできる方はいますか? https://t.co/gy0pId9Qw0 2025年1月20日
R1は、中国共産党が好まない話題について質問されると自らシャットダウンしたり、モデルをロボトミー化しユーザーエクスペリエンスを損なう可能性のある検閲を実証したりするなど、多くの課題に直面しています。OpenAIの元理事であるヘレン・トナー氏は次のように述べています。
「しかし、検閲はモデル自体ではなく、上位のレイヤーによって行われていることは明らかです。オープンソース版を実行していて、検閲が行われているかどうか、またどの程度行われているかをテストできる方はいらっしゃいますか?」
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。