Meta は、誰にも負けない AI 構築における OpenAI の 2 年間のリードに迫るために「粗雑な戦術」を使用したとされています…

  • abmhh
  • 0 comments
Meta は、誰にも負けない AI 構築における OpenAI の 2 年間のリードに迫るために「粗雑な戦術」を使用したとされています…
ノートパソコンのキーボードの上に置かれた携帯電話のディスプレイに表示された、Meta による LlaMA のテキスト。
Metaは、OpenAIの2年間のAIのリードを縮めるために「粗雑な戦術」に頼ったと報じられている。 (画像クレジット: Getty Images | SOPA)

MetaのAI開発の遅れが再び話題になっている。MicrosoftのCEO、サティア・ナデラ氏は先日、OpenAIがAI開発競争において、ChatGPTを開発するために2年間の猶予期間があったことを認めた。AnthropicやGoogleといった他の大手AIラボが急速にその遅れを取り戻している一方で、Metaは遅れを取り戻そうと必死にオフィスで長い一日を過ごしているようだ。

興味深いことに、同社の欺瞞的な戦術は、AI分野におけるOpenAIの急速な進歩に追いつくプロセスを加速させることを目的としていました。Meta AIの研究者Hugo Touvron氏宛てに、同社のgen AI担当VPが送ったメールには、同社が「GPT4になる必要がある」と書かれていました。これは「フロンティアを築き、この競争に勝つ方法」を学ぶことを意味します。

しかし、これらの目標を達成するためのフェイスブックの創設者の計画に関する複雑な詳細には、モデルのトレーニングに使用される書籍の著作権侵害サイト「Library Genesis(LibGen)」が関係していると報じられている。

The Vergeの厳しい報道では、Metaの製品ディレクターであるソニー・テアカナス氏がAIリサーチ担当バイスプレジデントであるジョエル・ピノー氏に送った別のメールも明らかにされました。このメールは、ブログ記事に掲載されているベンチマークのためにLibGenのデータを社内で使用するのか、それとも同サイトのデータを使ってモデルのトレーニングを行うのかを明確にするよう求めていました。テアカナス氏はメールの中で、Gen AIがLlama3でLibGenを使用することを承認されたと説明していましたが、その際には、海賊版または盗難とラベル付けされたデータは削除し、モデルのトレーニングに同サイトのデータを使用していることを明示しないなど、いくつかの緩和策が講じられていたとしています。

テアカナート氏によると、「LibgenはSOTA(最先端技術)の数値を満たすために不可欠です」とのことだ。さらに同氏は、この問題をMZ傘下の組織内の幹部、おそらくMetaのCEOであるマーク・ザッカーバーグ氏にエスカレーションした後、「OpenAIとMistralが自社のモデルにこのライブラリを使用していることは(口コミで)知られています」と付け加えた。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

著作権侵害はAIモデルのトレーニングにとって非常に重要であるようだ

2024年2月26日に撮影された写真には、米国の人工知能研究機関OpenAIが開発したChatGPTアプリのロゴがスマートフォンの画面に表示されている。

(画像クレジット:ゲッティイメージズ | キリル・クドリャフツェフ)

最近では、OpenAIやAnthropicといったトップAIラボが、高品質なコンテンツの不足により高度なAIシステムの開発に苦戦しているという報道が出ています。しかし、サム・アルトマン氏や元Google CEOをはじめとするAI業界のリーダーたちは、スケーリング則が始まっていることを示す証拠はなく、「壁はない」として、こうした主張に異議を唱えています。

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。