Stability AI lança versão 2.0 do Stable Diffusion
A atualização adota um novo encoder para geração de imagens a partir de texto com resolução de até 768x768 pixels, um upscaler que pode aumentar em 4 vezes a resolução de imagens, um novo modelo de difusão que pode deduzir a profundidade de uma imagem e um novo modelo de inpainting guiado por texto, que facilita a troca de partes da imagem.
Esquerda: imagem de 128 x 128. Direita: imagem com resolução 512 x 512, produzida pelo Upscaler.
O modelo de difusão de profundidade pode fazer uma imagem de entrada (à esquerda) produzir várias outras (à direita).