patchGAN-patchdiscriminatorの理解



Understanding Patchgan Patch Discriminator



参照:patchGAN-パッチディスクリミネーターとさまざまなテンソルフローの理解



https://github.com/ChengBinJin/V-GAN-tensorflow

【論文】 pix2pixからサイクルGANへのGAN画像変換



このセクションでは、GANの画像変換方法に関する2つの記事、つまりpix2pixGANとCycleGANを共有します。 2つの記事は、基本的に同じ著者のプログレッシブシリーズです。記事は最新ではありませんが、古くはありません。半年以上経った今、GANを使って画像を変換する初期の記事です。このパートでは、その実装プロセスについて詳しく説明します。

画像変換または画像スタイル変換は、その名前が示すように、「昼->夜」、「晴れ->雨の日」など、別の画像Bのモード/スタイルに従って1つの画像Aを変換する操作を指します。 。

いくつかの方法
深層学習法が広く使用された後、2016cvprの記事である深層学習法を使用してこれを比較的うまく行うにはCNNフレームワークを使用することです。「畳み込みニューラルネットワークを使用した画像スタイルの転送」は、深層畳み込みニューラルネットワークに基づく方法です。 。それが出たときもかなり暑かった、そしてそのような方法を改善するいくつかの方法があった。



画像生成(GAN)において本質的に強力なネットワーク構造の出現により、画像生成にGAN法を使用することが一般的な方法になりました。 GANの現在の使用法に基づいていくつかの方法を挙げてください。

pix2pix GAN(1611)
CycleGAN(1703)
DiscoGAN(1703)
PAN(知覚的敵対的ネットワーク)知覚されたGAN(1706)
StarGAN(1711)
これらのメソッドの最終結果は画像変換の場合があり、フォームの実装は異なります。最近のStarGANを含みます。

まず、各タイプのメソッドで効果を確認します。

深い畳み込みニューラルネットワークに基づく方法

è&iquestéåå&frac34çæè&iquest°

.................。

2.GANとcGANの基礎理論について
GANベースの画像変換方法を研究するには、まずGANの基本原理をある程度理解する必要があります。 GANの原則については、前のブログを参照してください。

ネットワークGANに対する単純な理解と実験的生成

ここで簡単に説明すると、GANは、そのアイデアが2人のゼロサムゲームのアイデアであり、ジェネレーターG +ディスクリミネーターDで構成され、ジェネレーターが実際の偽のサンプルを生成することを知っています。
弁別器は、サンプルの真と偽を判別するために使用されます。一般的なGANは、次の図で表すことができます。
è&iquestéåå&frac34çæè&iquest°

画像パッチ実験
この記事のもう1つの小さな構造上のポイントは、PatchGANを実験する方法です。つまり、ジェネレーターまたはディスクリミネーターに対して、画像全体の画像全体への入力としてではなく、小さなパッチとして使用します。画像をN * Nパッチに分割した後、ブロックごとに上記の操作を行います。 N = 1の場合、ピクセルごとに同等であることがわかります。 N = 256(画像サイズ256)の場合、1枚の画像と1枚の画像の演算です。もちろん、この記事の実験では、N = 70のときに効果が最も優れていることがわかりました。

実際、Nが固定ブロックの場合の最大の利点の1つは、とにかくブロックで作業しているため、小さな画像から大きな画像を生成できることです。たとえば、元の画像は256 * 256で、70 * 701ブロックごとです。トレーニングされたモデルは、変換が必要な1000 * 1000の画像がある場合、変換できます。1000を複数の70ブロックに変換するだけで、各ブロックを個別に変換できます。