Anthropic は、Claude AI がコーディングプロンプトを無視して Google で美しい国立公園の写真を見るという面白いデモを公開しました。…

  • abmhh
  • 0 comments
Anthropic は、Claude AI がコーディングプロンプトを無視して Google で美しい国立公園の写真を見るという面白いデモを公開しました。…
人類学的なクロード
アントロピック・クロード (画像提供:アントロピック)

知っておくべきこと

  • Anthropic は最近、新しい Computer Use API とともに、Claude 3.5 Sonnet のアップグレード バージョンを出荷しました。
  • AI企業は、コーディングを中断してイエローストーン国立公園の写真を見る例など、モデルの進歩を記録してきた。
  • 複数のレポートでは、AIの急速な普及により、コーディングは次世代の将来のキャリアパスとしては行き詰まる可能性があると示唆しているが、この発見はそうではないことを示唆している。

生成型AIの登場に伴い、この技術を用いた特定の職業の拡張について、多くの憶測や予測が飛び交っています。その結果、銀行業界、デザイン職、ソフトウェア開発といった分野が、AIによって真っ先に消滅の危機に瀕しているようです。

NVIDIAのCEO、ジェンスン・フアン氏は、ソフトウェア開発企業におけるAIの急速な導入により、コーディングが行き詰まる可能性があると示唆した。彼は次世代がソフトウェア開発を職業とすることを推奨せず、生物学、教育、製造業、農業など、別のキャリアパスを模索することを推奨した。 

Amazon Web ServicesのCEO、マット・ガーマン氏も同様の見解を示しており、ソフトウェア開発環境の劇的な変化を予測している。「今から24ヶ月後、あるいはもう少し先の未来――それがいつになるかは正確には予測できませんが――には、ほとんどの開発者がコーディングをしていない可能性があります」とガーマン氏は付け加えた。

ご存知の通り、AIは画像やテキストの生成段階をはるかに超え、コーディングのような高度で高度なタスクに取り組んでいます。例えば、OpenAIのGPT-4oとOpenAI-o1モデルは、コードの記述とエラー検出における高度な能力が高く評価されています。 

しかし、Anthropic の Claude AI モデルを使用した最近のコーディング デモを見ると、AI が人間から職業を奪うという予測が少し早まっていたのかもしれないことがわかります。

AIエージェントが主導する世界への準備はできているだろうか?まだ判断するには早すぎる

人類学のクロード 3.5 ソネット

アントロピック・クロード 3.5 ソネット(画像提供:アントロピック)

Anthropic は、アップグレードされた Claude 3.5 Sonnet の進歩を記録しているようで、興味深い発見がいくつかありました。 

同社のデモの一つでは、Claude AIがコードを書いている様子が見られますが、別の場面では思考回路が変わり、Googleに素早く切り替えてイエローストーン国立公園の画像ライブラリを操作している様子が見られます。あるユーザーはこう冗談を飛ばしています。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

「クロードは、私たちを氷河期に逆戻りさせる可能性のある休火山を無邪気に観察しています。」

これらのデモを録画している間にも、面白い瞬間がいくつかありました。ある時、クロードが長時間実行していた画面録画を誤って停止してしまい、すべての映像が失われてしまいました。その後、クロードはコーディングデモを中断し、イエローストーン国立公園の写真を眺め始めました。pic.twitter.com/r6Lrx6XPxZ 2024年10月22日

もう一つの注目すべき事例は、Claude AIが誤って長いクリップの画面録画を中断したことです。その過程で録画された映像が失われ、気が遠くなるような面倒な作業を最初からやり直さなければならなくなりました。

このニュースは、AI業界の大手テクノロジー企業がAIエージェントキャンペーンを用いたタスク自動化に注力している時期に発表されました。先日、Copilot Studioがまもなく自律型エージェントの作成をサポートすることが発表されました。SalesforceのAgentforceと同様に、MicrosoftのCopilotエージェントは、IT、マーケティング、営業、カスタマーサービス、財務など、あらゆる分野のタスク自動化を支援します。Salesforceのマーク・ベニオフ氏は、この発表を「パニックモード」と表現しました。

CEO は、Agentforce が優れた信頼できる代替品であると宣伝しながら、Microsoft を批判する機会を得ました。

Copilotが失敗に終わったのは、Microsoftが真の企業インテリジェンスを構築するためのデータ、メタデータ、そしてエンタープライズセキュリティモデルを欠いていたためです。そのため、Copilotは不正確で、企業データを流出させ、顧客に独自のLLM構築を強いることになります。Clippy 2.0はどうでしょうか?一方、Agentforceは今、ビジネスを変革しつつあります。Agentforceは単にタスクを処理するだけでなく、営業、サービス、マーケティング、分析、そしてコマースを自律的に推進します。データ、LLM、ワークフロー、そしてセキュリティがすべて単一のCustomer 360プラットフォームに統合されています。これこそがAIの本来あるべき姿です。

興味深いことに、MicrosoftはWindows Agent Arenaという新しいベンチマークを発表しました。これは、現実的なWindowsオペレーティングシステム環境でAIエージェントをテストするためのプラットフォームを提供します。このプラットフォームは、AIエージェントの開発を大幅に促進する可能性のある、深い研究のための手段となります。 

共有されたベンチマークによると、マルチモーダル AI エージェントの平均パフォーマンス成功率は 19.5% であるのに対し、人間の平均パフォーマンス評価は 74.5% と高く、セキュリティ上の問題が山積していることに加え、パフォーマンスに関する懸念も生じています。 

🎃ブラックフライデーのお得な早期セール🦃

  • 🎮Lenovo Legion Go (512GB) | Best Buy で 499.99 ドル (200 ドルお得!)
  • 📺LG 曲面 OLED 32 (QHD、240Hz) | Amazon で 909.99 ドル (590 ドルお得!)
  • 💻 ASUS ROG Zephyrus G14 (RTX 4060) | Best Buy で 1,249.99 ドル (300 ドルお得!)
  • 📺 HP Omen 27qs (QHD、240Hz) | Best Buy で 349.99 ドル (80 ドルお得!)
  • 🔊テレビ・モニター用 2.1ch サウンドバー | Walmart で 44.99 ドル(55 ドルお得!)
  • 🎧 Sennheiser Momentum 4 ANC | Amazon で 274.95 ドル(125 ドルお得!)
  • 📺LG C4 OLED 4K TV (42インチ) | Best Buy で 999.99 ドル (400 ドルお得!)

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。