Skip to content

Latest commit

 

History

History
87 lines (64 loc) · 2.63 KB

pixel2style2pixel.md

File metadata and controls

87 lines (64 loc) · 2.63 KB

Pixel2Style2Pixel

Pixel2Style2Pixel 原理

Pixel2Style2Pixel 的任务是image encoding。它主要是将图像编码为StyleGAN V2的风格向量,将StyleGAN V2当作解码器。

Pixel2Style2Pixel使用相当大的模型对图像进行编码,将图像编码到StyleGAN V2的风格向量空间中,使编码前的图像和解码后的图像具有强关联性。

它的主要功能有:

  • 将图像转成隐藏编码
  • 将人脸转正
  • 根据草图或者分割结果生成图像
  • 将低分辨率图像转成高清图像

目前在PaddleGAN中实现了人像重建和人像卡通化的模型。

使用方法

生成

用户使用如下命令中进行生成,选择本地图像作为输入:

cd applications/
python -u tools/pixel2style2pixel.py \
       --input_image <替换为输入的图像路径> \
       --output_path <替换为生成图片存放的文件夹> \
       --weight_path <替换为你的预训练模型路径> \
       --model_type ffhq-inversion \
       --seed 233 \
       --size 1024 \
       --style_dim 512 \
       --n_mlp 8 \
       --channel_multiplier 2 \
       --cpu

参数说明:

  • input_image: 输入的图像路径
  • output_path: 生成图片存放的文件夹
  • weight_path: 预训练模型路径
  • model_type: PaddleGAN内置模型类型,若输入PaddleGAN已存在的模型类型,weight_path将失效。 当前可用: ffhq-inversionffhq-toonify
  • seed: 随机数种子
  • size: 模型参数,输出图片的分辨率
  • style_dim: 模型参数,风格z的维度
  • n_mlp: 模型参数,风格z所输入的多层感知层的层数
  • channel_multiplier: 模型参数,通道乘积,影响模型大小和生成图片质量
  • cpu: 是否使用cpu推理,若不使用,请在命令中去除

训练(TODO)

未来还将添加训练脚本方便用户训练出更多类型的 Pixel2Style2Pixel 图像编码器。

生成结果展示

输入人像:

裁剪人像-重建人像-卡通化人像:

参考文献

@article{richardson2020encoding,
  title={Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation},
  author={Richardson, Elad and Alaluf, Yuval and Patashnik, Or and Nitzan, Yotam and Azar, Yaniv and Shapiro, Stav and Cohen-Or, Daniel},
  journal={arXiv preprint arXiv:2008.00951},
  year={2020}
}