DeepSeekのAIは、全く新しい中古ChatGPTなのか？ AI生成テキストの一致は「満場一致の陪審員」の判断によるもの…

Howero
abmhh
0 comments

DeepSeekとChatGPTは当初考えられていたよりもはるかに類似している。（画像クレジット：ゲッティイメージズ | ブルームバーグ）

中国のAIスタートアップ企業DeepSeekは、今年初め、極めて費用対効果の高いR1 V3搭載AIモデルを発表し、AI業界に突如として登場しました。しかし、数学、科学、コーディングなど、幅広いベンチマークにおいてOpenAIのo1推論モデルをわずかなコストで上回ったことで、投資家の間で懸念が高まりました。

別の報道によると、中国のAIスタートアップ企業は、NVIDIA Hopper GPU 5万台を含むハードウェアに最大16億ドルを費やしたという。OpenAIは、同社がコスト効率の高いAIモデルを学習するために、モデルを訓練するためにこの技術を使用していたと主張し、苦情を申し立てた。

ChatGPTの開発元は、DeepSeekがR1モデルの学習に「蒸留」技術を用いたと主張しています。ここで言う蒸留とは、企業（この場合はDeepSeek）が既存のモデル（OpenAI）の出力を活用して新しいモデルを学習するプロセスのことです。

これにより、同社はAIモデルの開発と訓練に必要な莫大な費用を削減できます。そして今、OpenAIの非難には一定の根拠があるように思われます。

AI検出企業Copyleaksによる新たな調査によると、DeepSeekのAI生成出力はOpenAIのChatGPTを彷彿とさせることが明らかになりました。さらに懸念されるのは、調査結果が74.2%の類似性を示したことです（Forbes経由）。

DeepSeekはOpenAIの著作権コンテンツを使ってAIモデルを学習したのだろうか？証拠はそれを示唆している

DeepSeek、ChatGPT、Google Gemini 向けの人工知能モバイルアプリを揃えました。 — DeepSeekはOpenAIの宿題をコピーしたのか？（画像提供：ゲッティイメージズ | ブルームバーグ）

Copyleaksは、スクリーニング技術とアルゴリズム分類器を用いて、AIモデルによって生成されたテキストを識別します。この調査では、分類器は全員一致で、DeepSeekの出力はOpenAIのモデルによって生成されたと判断しました。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

興味深いことに、AI検出企業はこのアプローチを用いて、OpenAI、Claude、Gemini、LlamaなどのAIモデルによって生成されたテキストを識別し、各モデルに固有のものとして識別しました。分類器は誤検知を減らすために、標準的な方法として全会一致投票を採用しています。

Copyleaks のデータサイエンス責任者 Shai Nisan 氏は次のように述べている。

「私たちの研究では『全員一致の陪審』アプローチを採用し、DeepSeekとOpenAIのモデルの間に強いスタイル上の類似性があることを確認しました。これは、調査した他のモデルでは見つかりませんでした。」

投資家たちは AI モデルの開発とトレーニングに多額の投資がなされていることに懸念を抱き始めていたが、調査結果は DeepSeek の AI モデルのトレーニングと開発、そしてそのアプローチが本当に費用対効果の高いものであったかどうかについて疑問を投げかけている。

日産が強調したように:

この類似性はDeepSeekが派生的な技術であると明確に証明または断言するものではありませんが、その開発過程について疑問を提起しています。私たちの研究は特に文章スタイルに焦点を当てており、その領域においてOpenAIとの類似性は顕著です。OpenAIの市場における優位性を考慮すると、私たちの研究結果はDeepSeekのアーキテクチャ、学習データ、開発プロセスについてさらなる調査が必要であることを示唆しています。

DeepSeek が著作権侵害で有罪判決を受けた場合、今後はどうなるのでしょうか?

DeepSeek のロゴがモバイル画面に表示されます。 — では、DeepSeek がコピーしたことが判明した場合、次に何が起こるのでしょうか? (画像提供: Getty Images | Anadolu)

さらに、DeepSeek が自社のエントリーをトレーニングするために OpenAI のモデルを使用したことを明確に示さなかったことで、状況はさらに悪化し、法的および財務上の大きな障害が生じています。

Copyleaks のデータサイエンス責任者によると:

「この調査は、透明性と強力な知的財産保護がAI開発と規制の将来において最も重要であることを強く示唆しています。規制当局は、企業に対し、モデルの学習に使用したデータセットとモデル出力に関する詳細な情報の開示を義務付けることを検討する可能性が高いでしょう。」

OpenAIの地下には複数の著作権侵害の幽霊がいる

OpenAI CEO サム・アルトマン氏がモバイルデバイスの画面に映っている。 — OpenAIは著作権侵害問題に悩まされてきました。（画像提供：Getty Images | NurPhoto）

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。