Microsoft lança "Visual ChatGPT" onde mistura o ChatGTP com Geração de Imagens · filipedeschamps

Turma, o futuro vai ser massa. A Microsoft acabou de lançar de forma open source o Visual ChatGPT onde você possui um chat (como no ChatGPT), mas que consegue enviar e receber imagens, e todo o processo de construção de uma nova imagem (ou modificação de uma) é feito por meio deste chat.

De forma grosseira, é o casamento entre o ChatGPT e o Stable Diffusion:

Visual ChatGPT em demonstração

Neste exemplo acima acontecem duas coisas, onde primeiro:

O usuário pede para gerar a imagem de um gato, onde é retornado um gato lendo um livro.
Depois o usuário pede para substituir o gato por um cachorro e remover o livro.
Depois pede para detectar as bordas da imagem (canny edges).
E por fim, pede para criar um "cachorro amarelo" a partir da última imagem.

E na segunda parte do GIF:

O usuário envia a foto de uma moto.
Pergunta qual a cor da moto, que recebe corretamente como resposta que a moto é preta.
Depois pede para remover a moto, e a moto é removida da imagem.
Por fim, pergunta o que tem nessa foto? E recebe como respota que tem um quintal.