【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 #1146

XvLingWYY · 2025-04-27T05:20:55Z

PR types

New Features

PR changes

Others

Describe

Add wgangp

paddle-bot · 2025-04-27T05:21:00Z

Thanks for your contribution!

XvLingWYY · 2025-04-27T05:23:39Z

@robinbg

Update wgangp_toy.py

Update functions.py

luotao1 · 2025-05-12T08:15:35Z

@XvLingWYY
请参考下 Code Review 注意事项

和提交 PR 注意事项

lijialin03 · 2025-05-12T08:25:56Z

对于相同目的的反复修改，在git push之前在本地修改的时候，可以使用git commit --amend，而不是git commit -m "新的信息"，这样可以把修改改在上一个commit上，然后再push就会更新commit而不是创建新的

XvLingWYY · 2025-05-12T11:25:28Z

通过网盘分享的文件：models.zip
链接: https://pan.baidu.com/s/1ekP99D2ylox3yzqxQkJkyw?pwd=wgan 提取码: wgan
这是更改后的模型和可视化内容，在之前的基础上增加了MNIST和CIFAR10的可视化图片。
由于paddle和tensorflow中inception v3模型不一样，以及模型转化始终报错导致使用我的实现的S分数评估模型模型只有5.2左右的分数，所以在CIFAR10中附加了模型评估代码使用的是原作者仓库中的模型。使用原作者仓库中的模型IS分数可以达到要求。
对于mnist当前参数训练后再评估，mse loss约0.47，在论文中作者并未对MNIST数据集上的实验进行mse loss评估，从可视化的图片中可以看见模型生成的图片与真实图片一样都是手写数字并且都可以识别出内容并非不同。

lijialin03 · 2025-05-14T03:36:27Z

通过网盘分享的文件：models.zip 链接: https://pan.baidu.com/s/1ekP99D2ylox3yzqxQkJkyw?pwd=wgan 提取码: wgan 这是更改后的模型和可视化内容，在之前的基础上增加了MNIST和CIFAR10的可视化图片。由于paddle和tensorflow中inception v3模型不一样，以及模型转化始终报错导致使用我的实现的S分数评估模型模型只有5.2左右的分数，所以在CIFAR10中附加了模型评估代码使用的是原作者仓库中的模型。使用原作者仓库中的模型IS分数可以达到要求。对于mnist当前参数训练后再评估，mse loss约0.47，在论文中作者并未对MNIST数据集上的实验进行mse loss评估，从可视化的图片中可以看见模型生成的图片与真实图片一样都是手写数字并且都可以识别出内容并非不同。

网盘里的包下载打开后，mnist这个目录中的图片是：

imagex和image_real_x的标号是一一对应的吗，如果是的话这看起来不是都不相同吗……？

XvLingWYY · 2025-05-14T04:51:13Z

imagex和image_real_x的图片两个并没有任何关系，只是恰好出现在一个batch_size里

XvLingWYY · 2025-05-14T04:58:39Z

当向不了解生成对抗网络（GAN）的人解释为什么在每个batch size中真实图片和生成的图片并不一样，不能使用均方误差（MSE）损失评估时，可以这样来解释：

想象你正在教一个孩子画画。这个孩子刚开始学习如何画猫。每次你给他看一张真实的猫的照片，并让他尝试画出这张照片中的猫。但这里有个问题：孩子每次画出来的猫都不一样，而且与任何他之前看到的真实猫的照片也不完全相同。

如果我们用一种非常简单的方式来评价孩子的作品，比如说“看看你的画和这张照片里的猫有多接近”，我们实际上是在测量两幅图像之间的像素差异——这就像MSE损失所做的。但是，在这种情况下，这种方法并不是很有帮助，因为目标不是让孩子精确地复制每一张照片，而是要让他们能够画出看起来像猫的图像，即使这些图像没有一张与特定的照片一模一样。

在GANs中，生成器的任务是创建看起来逼真的图像，而不是精确复制训练集中的图像。因此，使用MSE这样的度量标准来比较生成的图像和真实图像并不合适，因为它会惩罚那些虽然看起来很真实但与具体某张训练图像不同的生成结果。相反，GANs使用了一种更智能的方法，即通过判别器网络来判断一张图像是来自真实数据分布还是由生成器创造的，从而引导生成器产生更加逼真的图像。

总结来说，关键点在于GAN的目标是让生成的图像具有足够的真实感，而不是让它们与某个特定的真实图像尽可能相似。这就需要采用不同于MSE的评价方法，比如对抗性损失，来指导模型的学习过程。

lijialin03 · 2025-05-14T05:41:54Z

当向不了解生成对抗网络（GAN）的人解释为什么在每个batch size中真实图片和生成的图片并不一样，不能使用均方误差（MSE）损失评估时，可以这样来解释：

想象你正在教一个孩子画画。这个孩子刚开始学习如何画猫。每次你给他看一张真实的猫的照片，并让他尝试画出这张照片中的猫。但这里有个问题：孩子每次画出来的猫都不一样，而且与任何他之前看到的真实猫的照片也不完全相同。

如果我们用一种非常简单的方式来评价孩子的作品，比如说“看看你的画和这张照片里的猫有多接近”，我们实际上是在测量两幅图像之间的像素差异——这就像MSE损失所做的。但是，在这种情况下，这种方法并不是很有帮助，因为目标不是让孩子精确地复制每一张照片，而是要让他们能够画出看起来像猫的图像，即使这些图像没有一张与特定的照片一模一样。

在GANs中，生成器的任务是创建看起来逼真的图像，而不是精确复制训练集中的图像。因此，使用MSE这样的度量标准来比较生成的图像和真实图像并不合适，因为它会惩罚那些虽然看起来很真实但与具体某张训练图像不同的生成结果。相反，GANs使用了一种更智能的方法，即通过判别器网络来判断一张图像是来自真实数据分布还是由生成器创造的，从而引导生成器产生更加逼真的图像。

总结来说，关键点在于GAN的目标是让生成的图像具有足够的真实感，而不是让它们与某个特定的真实图像尽可能相似。这就需要采用不同于MSE的评价方法，比如对抗性损失，来指导模型的学习过程。

好的，明白了，谢谢

XvLingWYY · 2025-05-17T05:28:01Z

老师距离上次提交已经过了4个工作日了，还有需要修改的地方吗？

lijialin03

运行结果上没什么问题了，但是还有下面这些点可能容易让人疑惑，还可以再优化一下吗？
另外改完之后点resolved就行，不用再逐条回复了，谢谢

examples/wgangp/wgangp_cifar10.py

lijialin03 · 2025-05-19T02:29:34Z

examples/wgangp/wgangp_cifar10.py

+                for i in range(
+                    cfg["EVAL"]["batch_size"]
+                    if cfg["EVAL"]["batch_size"] < cfg.VIS.num
+                    else cfg.VIS.num
+                ):


这个应该是因为batch_size变为1之后影响了BatchNorm，测试了一下batch_size最少要在8左右基本对结果没有影响。另外还有个问题是为什么batch_size变为1之后，eval过程的loss值没有变化（且都很大），我看代码loss里是判断的当前图片和真实图片的判别器结果的差异，所以说不论batch_size变不变，判别器都认为是假图片吗

examples/wgangp/wgangp_cifar10.py

XvLingWYY · 2025-05-20T02:33:18Z

”这个应该是因为batch_size变为1之后影响了BatchNorm，测试了一下batch_size最少要在8左右基本对结果没有影响。“
generator_model.eval()
添加这一行后可以有效解决图片质量下降的问题
“另外还有个问题是为什么batch_size变为1之后，eval过程的loss值没有变化（且都很大），我看代码loss里是判断的当前图片和真实图片的判别器结果的差异，所以说不论batch_size变不变，判别器都认为是假图片吗”
我把Cifar10GenFuncs中的fake_data替换为real_data后发现输入真实图片后结果相同loss值没有变化（且都很大）所以模型只是分不清，并且图片的质量主要是靠IS分数进行评估。

lijialin03

LGTM

XvLingWYY added 4 commits April 27, 2025 13:11

Create wgangp.yaml

0b02a82

Add files via upload

83ecd01

Add files via upload

0f56f37

Add files via upload

51befb3

paddle-bot bot added the contributor label Apr 27, 2025

Delete examples/wgangp/conf/wgangp.yaml

532f852

XvLingWYY changed the title ~~【Hackathon 8th No.23】RFC：Improved Training of Wasserstein GANs 论文复现~~ 【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 Apr 27, 2025

XvLingWYY added 21 commits April 27, 2025 18:16

Update wgangp_cifar10.yaml

f0da2e9

Update functions.py

5f18b0b

Update wgangp_cifar10.py

c3d753d

Update model.py

84230d1

Update wgangp_cifar10.py

8331599

Update wgangp_mnist.py

326da7a

Update wgangp_toy.py

b06cee6

Update wgangp_toy.py

Update functions.py

93118bf

Update functions.py

Update model.py

ba7481b

Update wgangp_cifar10.py

afbd7d8

Update wgangp_mnist.py

e3fddbd

Update wgangp_toy.py

3068ff6

Update wgangp_cifar10.yaml

0c2b21c

Update model.py

bdf54d2

Update wgan_gp.md

c0e34b3

Update wgangp_cifar10.yaml

127650b

Update model.py

617c9f3

Update wgan_gp.md

acf302f

Update wgan_gp.md

9549f1a

Update wgan_gp.md

6871216

Add files via upload

2c38a16

XvLingWYY added 10 commits May 10, 2025 12:59

Add files via upload

8bae84a

Add files via upload

5b7b437

Add files via upload

af72624

Add files via upload

3cbafe5

Add files via upload

d0d8249

Add files via upload

5b43407

Add files via upload

cf80107

Delete examples/wgangp_toy_model.py

56e5d68

Add files via upload

6c872c8

Add files via upload

0722c3c

XvLingWYY added 2 commits May 12, 2025 19:00

Add files via upload

71a103f

Add files via upload

071fbd7

XvLingWYY added 6 commits May 12, 2025 19:35

Merge branch 'PaddlePaddle:develop' into develop

a3ec077

Delete docs/zh/examples/wgan_gp.md

0cc7ef7

Delete docs/index.md

5f6489c

Delete mkdocs.yml

7811c40

Add files via upload

353d6e7

Add files via upload

3885f41

lijialin03 reviewed May 19, 2025

View reviewed changes

Add files via upload

d8d9ca1

lijialin03 approved these changes May 20, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 #1146

【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 #1146

XvLingWYY commented Apr 27, 2025

paddle-bot bot commented Apr 27, 2025

XvLingWYY commented Apr 27, 2025

luotao1 commented May 12, 2025

lijialin03 commented May 12, 2025

XvLingWYY commented May 12, 2025

lijialin03 commented May 14, 2025

XvLingWYY commented May 14, 2025

XvLingWYY commented May 14, 2025

lijialin03 commented May 14, 2025

XvLingWYY commented May 17, 2025

lijialin03 left a comment

lijialin03 May 19, 2025

XvLingWYY commented May 20, 2025

lijialin03 left a comment

【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 #1146

Are you sure you want to change the base?

【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 #1146

Conversation

XvLingWYY commented Apr 27, 2025

PR types

PR changes

Describe

paddle-bot bot commented Apr 27, 2025

XvLingWYY commented Apr 27, 2025

luotao1 commented May 12, 2025

lijialin03 commented May 12, 2025

XvLingWYY commented May 12, 2025

lijialin03 commented May 14, 2025

XvLingWYY commented May 14, 2025

XvLingWYY commented May 14, 2025

lijialin03 commented May 14, 2025

XvLingWYY commented May 17, 2025

lijialin03 left a comment

Choose a reason for hiding this comment

lijialin03 May 19, 2025

Choose a reason for hiding this comment

XvLingWYY commented May 20, 2025

lijialin03 left a comment

Choose a reason for hiding this comment