Standard GAN :
- Generator (G):輸入隨機噪聲 z∼N(0,1),輸出 fake image
- Discriminator (D):輸入一張圖像(可能來自真實 MNIST,也可能是 G 的 fake),判斷 real/fake
- 是MNIST 資料集的圖像 → 標記為 real (y=1)
- G(z) 生成的假圖像 → 標記為 fake (y=0)
- D 不需要 paired data,只要能看到真實數據與生成數據
- 訓練過程中,G 會逐步學會把隨機 z 映射到「看起來像 MNIST 分佈」的圖像

Conditional GAN
想要生成「數字6」,就給模型條件
- y=6,生成器要輸出像「6」的圖片,而不是別的數字。
- 圖片裡面打叉的「2」就是說:雖然它來自分佈,但不符合條件(y=6),所以不是正確輸出
Conditional GAN:
Learn a mapping from condition → target (e.g. noisy → clean)
- Discriminator (D):同時看 (noisy, clean) 或 (noisy, fake)
- (noisy, clean) → 應該判斷為 real (y=1)
- (noisy, fake) → 應該判斷為 fake (y=0)
- D 的角色不只是判斷「像不像真實圖像」,還要檢查「輸出和 noisy 是否對應」
- 透過 Binary Cross Entropy loss,D 訓練得更會分辨;而 G 則被迫學到正確 mapping (noisy → clean)
沒有留言 :
張貼留言