Executando verificação de segurança...
2

Muito interessante o experimento. Gostei da conclusão do autor:

Do ponto de vista monetário, gastei 30 dólares no processo todo (no final, eu estava gerando 2-3 edições/variações por minuto). Em outras palavras, não muito.

Embora eu ache que o verdadeiro avanço virá quando DALL-E ficar 10-100x mais barato (e mais rápido). Então, eu imaginaria o seguinte processo de trabalhar com ele (que na verdade é apenas uma otimização em cima do que estou fazendo agora):

  1. Você escreve uma frase.
  2. São mostradas a você uma centena de fotos para essa frase, de preferência de regiões muito diferentes do espaço latente.
  3. Você seleciona as que melhor combinam com o que deseja.
  4. Volte para o ponto 2, 4-5 vezes, obtendo sempre melhores resultados.
  5. Agora você pode escrever uma frase para o que gostaria de alterar (editar) e a imagem original seria usada como linha de base. Volte para o ponto 2 até ficar satisfeito.
Carregando publicação patrocinada...
2

O interessante de se notar dessa conclusão é que isso é basicamente o mesmo fluxo com um artista gráfico, com uma diferença interessante: não há ego envolvido pela parte de quem está gerando as imagens.

E isso é um tradeoff, mas não deixa de ser um tradeoff interessante, pois o DALL-E não se importa com o resultado final, diferente do artista.