Microsoft lança "Visual ChatGPT" onde mistura o ChatGTP com Geração de Imagens
Turma, o futuro vai ser massa. A Microsoft acabou de lançar de forma open source o Visual ChatGPT onde você possui um chat (como no ChatGPT), mas que consegue enviar e receber imagens, e todo o processo de construção de uma nova imagem (ou modificação de uma) é feito por meio deste chat.
De forma grosseira, é o casamento entre o ChatGPT e o Stable Diffusion:
Neste exemplo acima acontecem duas coisas, onde primeiro:
- O usuário pede para gerar a imagem de um gato, onde é retornado um gato lendo um livro.
- Depois o usuário pede para substituir o gato por um cachorro e remover o livro.
- Depois pede para detectar as bordas da imagem (canny edges).
- E por fim, pede para criar um "cachorro amarelo" a partir da última imagem.
E na segunda parte do GIF:
- O usuário envia a foto de uma moto.
- Pergunta qual a cor da moto, que recebe corretamente como resposta que a moto é preta.
- Depois pede para remover a moto, e a moto é removida da imagem.
- Por fim, pergunta o que tem nessa foto? E recebe como respota que tem um quintal.