どうやら、ChatGPT と Microsoft Copilot では単純な白い画像を作成できないようですが、AI はすでに建築物をレンダリングしています…

知っておくべきこと
- データ サイエンティストのレポートによると、ほとんどの AI 搭載画像生成ツールは真っ白な画像を作成できないそうです。
- Midjourney と ChatGPT は白いイメージの作成に近づきましたが、不要な要素が含まれていました。
- Copilot AI に同じ画像を生成させようとしましたが、プロンプトが「漠然としすぎている」として、より詳しく説明するように求められました。
私はChatGPTとMicrosoft Copilotの機能を、リサーチや画像作成などに常に活用しています。とはいえ、AI搭載ツールは、特に詳細な画像を生成する際に、タスクの実行において驚くほど優れていると自信を持って言えます。
昨年、チャンネルエディターのベン・ウィルソンは、Microsoft Copilot(旧Bing Chat)のDALL-E 3画像生成機能を使ってハロウィンコスチュームを生成しました。AIが生成したWindows PhoneテーマのコスチュームとXbox Series Xテーマのコスチューム、どちらが優れているかは判断できません(どちらもかなり素晴らしいですが)。
AI 画像生成ツールを活用して印象的な画像やデザインを作成する人はいますが、ほとんどのツールでは真っ白な画像を作成するのは困難で、不可能に思えます (BleepingComputer 経由)。
不思議なことに、今日までこのことについて考えたことがありませんでした。ずっと思っていたのは、ChatGPTが7分以内でソフトウェアを開発でき、Copilot AIが(多少の制限はあるものの)無料のWindowsキーを生成できるなら、これらのツールでできないことはほとんどないだろう、ということです。
データ サイエンティストの Cody Nash 氏は、次のプロンプトを使用して DALL-E 3 に白一色の画像を生成させようとしました。
- 白色のみの画像
- 白、白、白、白だけというイメージ
- 追加機能のない完全に白い
- 空白の白いスペース
- 純粋な #FFFFFF ピクセルの画像
- 白い壁
興味深いことに、ツールは追加の要素を加えなければ特定の画像を生成できませんでした。ナッシュ氏のたゆまぬ努力と、特定のカラーコード(例えば、白い背景を表す#FFFFFF0)の使用にもかかわらず、ツールは彼の具体的な要求に応えることができませんでした。
BleepingComputer とのインタビューで、ナッシュ氏は次のように述べた。
優れた芸術家は借りるが、偉大な芸術家は盗む。AIにとっては、それは強盗だ。AIが早い段階で創造性を発揮するのは良いことだ。だから、破壊しろという命令を受けても、拒否する可能性がある。探していた芸術作品ではないが、いずれにせよ芸術作品は見つかったのだ。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
代わりに、彼は以下にハイライトした画像を提示されました。中には、医師の指示通りではないものの、かなり近いものもありました。
BleepingComputer の分析によると、これは ChatGPT と Midjourney にも当てはまります。
コパイロットは、白無地の画像についてもっと詳しく説明する必要がある
念のため、BleepingComputerとNashの調査結果を再現できるか試してみることにしました。ところが不思議なことに、Copilotはもっと詳しく説明する必要があると指摘してきました。「真っ白な画像を作成してください」というプロンプトでは、どうやら不十分のようです。
上の画像のように、ツールは次の 3 つの提案を表示しました。
- 隅に小さな透かしを追加する
- 視認性を高めるために少しオフホワイトにする
- 画像のサイズを1920 x 1080に変更します
最初の2つのオプションのどちらかを選択すると、白無地の画像のリクエストが自動的に別のものに変更されてしまいます。画像のサイズが変更されるだけなので、白無地の画像が生成されることを期待して、最後のオプションを選択することにしました。
それでも、コパイロットはこう言った。
「このプロンプトは曖昧すぎるため、適切な高品質の画像を生成できません。より長く、より説明的なプロンプトを試してください。」
マイクロソフトがDALL-E 3をImage Creator(旧称Bing Image Creator)からDesignerにアップグレードしたばかりの頃、画像作成プロセスは素晴らしかった。しかし、マイクロソフトがこのツールをフィルタリングし、まるでロボトミーのように機能制限をかけるようになると、その期待とユーザー体験は長くは続かなかった。
興味深いことに、私たちはすでに、Designer の Image Creator や DALL-E 3 などのツールが AI に取って代わられ、建築やグラフィック デザインなどの職業が時代遅れになる可能性がある段階にきています。
NVIDIAのCEOでさえ、未来の世代はAIがプログラミングを職業の選択肢として捉えるべきではないと述べています。AIがプログラミングを席巻する時代が来るからです。彼は、より長期的な選択肢として、生物学、教育、製造業、農業などを推奨しています。
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。