この新しいAppleのAI画像ツールは、Microsoftが自社のAI画像作成ツールとして採用すべきものだ。その理由は以下の通り。

  • abmhh
  • 0 comments
この新しいAppleのAI画像ツールは、Microsoftが自社のAI画像作成ツールとして採用すべきものだ。その理由は以下の通り。
建物に描かれたAppleのロゴ
(画像提供:Future)

知っておくべきこと

  • Apple の研究者は、ユーザーがテキストプロンプトを使用して画像を編集できる新しい AI 画像ツールを公開しました。
  • MLLM ガイド付き画像編集 (MGIE) ツールでは、テキスト プロンプトを使用して画像のサイズ変更、反転、切り取り、さらにはフィルターの追加も行うことができます。  
  • このモデルは GitHub からダウンロードできますが、Apple はこのモデルに関する計画を明確に発表していません。

生成AI技術の急速な普及に伴い、MicrosoftのImage Creator from Designer(旧Bing Image Creator)やMidjourneyといった画像生成ツールが次々と登場しています。これらのモデルの熱心なユーザーとして、既に生成した画像を手軽に編集する方法がないのは困りものです。

Googleは、実験的な画像生成ツール「ImageFX」でこの問題の解決に向けて着実に歩みを進めています。他のツールと一線を画すのは、プロンプトを使って画像を生成するだけでなく、ユーザーが表現チップを使ってプロンプトを変更できる点です。これにより、出力結果の微調整が容易になります。 

そして今、AppleもAIを活用した新しいモデルでこの競争に加わったようだ。このモデルを使えば、ユーザーはソフトウェアを操作せずに写真に加えたい変更内容を説明できる。MLLMガイド付き画像編集(MGIE)モデルは、テキストプロンプトを使って画像のサイズ変更、反転、トリミング、さらにはフィルターの追加まで行うことができる。  

MGIEモデルはプロンプトを解釈し、ユーザーが説明する変更内容を「イメージ」してから、リアルタイムで適用します。研究論文では、研究者たちはペパロニピザの写真と「もっとヘルシーに」というプロンプトを、写真に適用したい変更内容の指示として用いました。その結果、モデルはペパロニピザに野菜を追加しました。 

研究者によると:

MGIEは、簡潔かつ曖昧なガイダンスではなく、明確な視覚認識の意図を導き出し、合理的な画像編集へと導きます。私たちは編集の様々な側面から広範な研究を行い、MGIEが競争力を維持しながらパフォーマンスを効果的に向上させることを実証しました。また、MLLMに基づくフレームワークは、将来の視覚と言語の研究に貢献できると考えています。

Appleの新しいAIモデルでは、プロンプトを使用して写真を編集できます

Appleの新しいAIモデルでは、プロンプトを使って写真を編集できます(画像提供:Apple)

画像生成をより簡単かつ迅速にする可能性のある、この非常に必要な機能を備えた AI モデルが出荷されるのは素晴らしいことです。 

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

AIディープフェイクは依然として問題となっている

Microsoft Edge サイドバー内の Bing Image Creator

(画像提供:TwitterのMikhail Parakhin)

AIを使った画像生成は、人々がその技術を偽画像や露骨なコンテンツの作成に利用し始めるまでは、楽しい遊びのようなものです。ポップスターのテイラー・スウィフトは最近、Microsoft Designerで生成されたと思われる露骨な画像がソーシャルメディアに流出し、大きな話題となりました。 

Microsoft Designer がアップデートされ、ユーザーがツールを使って露骨なコンテンツを作成することを阻止するための新たな規制とガードレールが導入されたことは注目に値します。これは、こうした行為を規制・防止するために新たに施行された「露骨な偽造画像および合意に基づかない編集の阻止に関する法律(DEFIANCE法)」に準じたものです。 

ガードレールと検閲により、このような事態が再び発生する可能性は大幅に減少しますが、ユーザーからは、これらの対策の一部は行き過ぎであり、Designer の Image Creator などのツールがロボトミー手術を受けたように見えると苦情が出ています。 

過去には、複数のユーザーがAIチャットボットを騙して制限されたタスクを実行させた事例がありました。例えば、あるユーザーがChatGPTを騙してWindowsキーを生成させたケースです。そのため、Appleの研究者は、あらゆる抜け穴を補うために、この問題を徹底的に調査する必要があります。

AppleがMGIEに関して、研究以外にどのような計画を持っているのかは依然として不明ですが、モデルはGitHubからダウンロード可能です。AppleはAI分野では比較的沈黙を守ってきましたが、今年に入ってから徐々に前進し、この技術に積極的に取り組んでいます。一方、Microsoftは絶好調で、AI分野で早くからリードし、数十億ドル規模の投資を行っており、現在では世界で最も価値のある企業リストのトップに躍り出ています。 

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。