拡散モデル(Diffusion Model)とは?

読み方: カクサンモデル

30秒まとめ

ノイズからデータを段階的に生成するAIモデル。画像・動画生成AIの中核技術。

拡散モデル(Diffusion Model)の意味・定義

拡散モデル(Diffusion Model)は、データにノイズを段階的に加えていく過程(拡散過程)を逆転させることで、ランダムなノイズから高品質なデータを生成する生成AIモデルです。学習時にはデータにノイズを加える過程を学び、生成時にはノイズを段階的に除去してデータを復元します。Stable Diffusion、DALL-E 3、Midjourneyなど、現在の主要な画像生成AIのほとんどが拡散モデルをベースに構築されています。GANs(敵対的生成ネットワーク)と比較して、学習の安定性と生成品質に優れているため、急速に普及しました。画像生成だけでなく、Soraなどの動画生成、音声合成、3Dモデル生成など、多様なコンテンツ生成への応用が進んでいます。テキストプロンプトから高品質な画像を生成するText-to-Image技術の基盤として、クリエイティブ分野に革命をもたらしています。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール