新しい最先端 AI モデルは、超高速の画像生成速度と OpenAI の Sora ビデオ機能を誇ります。

知っておくべきこと
- 韓国の科学者らは最近、「KOALA」と呼ばれる新しいAI画像生成モデルを開発した。
- Microsoft の Designer の Image Creator などの他のモデルとは異なり、このツールはより高速な画像生成速度を誇ります。
- これは、Stable Diffusion XL と呼ばれるオープンソースの画像生成ツールのサイズを圧縮する、知識蒸留と呼ばれる新しい手法を活用しています。
- この方法により、古い GPU を搭載した古い PC でも、より速く画像を生成できます。
AI を活用した新しい画像ジェネレーターが間もなく登場し、Microsoft の Image Creator from Designer (旧 Bing Image Creator)、Midjourney、OpenAI の DALL-E 3 モデルに対抗する可能性があります。
この新しいツールは2秒未満で画像を生成でき、一般的な画像生成ツールよりもはるかに高速です。Live Scienceのスポット記事によると、この新発明を開発した韓国の科学者たちは、「知識蒸留」と呼ばれる新しい技術を活用し、オープンソースの画像生成ツール「Stable Diffusion XL」のサイズを圧縮しました。
この AI ツールはどのように機能しますか?
ちなみに、Stable Diffusion XLは最大25億6000万個のパラメータを備えています。ご存知のとおり、AIは学習に画像を含む既存のコンテンツに大きく依存しています。この膨大なパラメータ数のため、画像生成には多少の時間がかかります。しかし、この新しい技術により、最小モデルであるKOALAのパラメータ数は7億個にまで削減されました。
そのため、このツールは瞬時に画像を生成できます。画像生成モデルは、ハイエンドGPUや高度なデバイスを必要とせず、スムーズに動作させることができます。画像生成に必要なRAMは約8GBです。基本的に、知識蒸留技術は、品質やパフォーマンスに影響を与えることなく、大規模なモデルから小規模なモデルへと情報をふるいにかけます。これにより、小規模なモデルはより高速に高品質の画像を生成できます。
関連:MicrosoftのImage Creatorの画像生成速度は耐え難いほど遅い
科学者らが公開したベンチマークによると、KOALAはOpenAIのDALL-E 3やDALL-E 2モデルよりも大幅に高速です。「火星の月の下で本を読む宇宙飛行士の画像」を生成するように指示された際、前者は13.7秒、後者は12.3秒かかりました。KOALAはわずか1.6秒で画像生成に成功しました。
KOALAには5つのバージョンがあります。3つのバージョンはテキストプロンプトに基づいて画像を生成し、残りの2つのバージョン(Ko-LLaVA)は画像と動画の両方を生成できます(OpenAIのSoraモデルと同様)。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
韓国電子通信研究院(ETRI)の科学者たちは、オープンソースのAIリポジトリ「Hugging Face」とarXivデータベースで研究成果と研究結果を共有した。
科学者たちは、これらのモデルを既存の画像生成サービスやコンテンツ制作などに統合する予定です。
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。