ポスト

逆拡散はある意味で反復的な超解像の適用みたいな感じなのでシャープな画像が生成されるのかな。一方 GAN は discriminator を騙しきれたら良くて、ちょっとぼんやりしているくらいが騙しきりやすくて、その辺で訓練が収束する的な。細部はうまく言語化はできないな…。

メニューを開く

derwind@s_derwind

みんなのコメント

メニューを開く

ガイダンスやプロンプティングで「こういうのを作って欲しい」って場合も、textual inversion と言うのか、“うまく言語化できないが、具体例でプロンプティングの単語埋め込み S* を導出する” ようなやつが駆使できると生成品質もっと上がるんだろうか。学ぶべきテクニックも多いなぁ…。

derwind@s_derwind

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ