O que significa Dall-E2 e difusão estável tendo o mesmo prompt, mas resultados diferentes

O Que Significa Dall E2 E Difusao Estavel Tendo O Mesmo Prompt Mas Resultados Diferentes



Dall-E2 ' e ' Difusão estável ”são ambos geradores de imagens baseados em IA que convertem as solicitações de texto do usuário em fotografias. Dall-E foi originalmente lançado por “ IA aberta ” em janeiro de 2021, enquanto sua versão atualizada Dall-E2 chegou em abril de 2022. No entanto, Stable Diffusion foi criado por “ IA de estabilidade ” e aberto ao público em agosto de 2022. Ambas as plataformas se esforçam para criar uma aparência realista para a entrada de texto de seus usuários. O Stable Diffusion é gratuito para todos na plataforma Playground AI, mas o Dall-E2 é baseado em assinatura.

Neste artigo, testaremos os mesmos prompts em ambas as plataformas e verificaremos qual produz as melhores imagens realistas.

O que significa Dall-E2 e difusão estável com os mesmos resultados diferentes?

Stable Diffusion pode ser usado totalmente de graça no Playground AI local na rede Internet . Dall-E2 pode ser acessado fazendo login com suas credenciais pessoais no Open AI local na rede Internet . Depois de abrir as respectivas páginas da web, os usuários são direcionados para uma caixa de entrada de texto onde podem inserir seus prompts para gerar imagens. Os usuários também podem especificar o estilo de imagens que desejam criar.







Os prompts de texto podem ser tão detalhados quanto possível, porque quanto mais informações a IA puder processar, melhor será o resultado final. No entanto, deve-se tomar cuidado para não se empolgar demais ou os resultados começarão a parecer completamente irrealistas.



Exemplo 1

Em nosso primeiro exemplo, geramos a imagem de um unicórnio em um campo gramado. Os detalhes nos prompts ajudam esses criadores baseados em IA a adicionar detalhes específicos para criar uma imagem coerente:



Pintura em aquarela de um unicórnio branco galopando em um campo de grama verde, colorido, cores vivas, fantasia, escuro, hiper-realista, divino, visões mágicas.

Resultado Dall-E2





Resultado de difusão estável

Exemplo 2

Neste exemplo, inserimos o seguinte prompt sobre um homem e um cachorro em uma caverna com cores vibrantes. Isso pode testar a capacidade do Dall-E2 e do Stable Diffusion de criar imagens com cores vivas:



Arte digital de um explorador de cavernas masculino e seu labrador dourado visitando uma cachoeira no meio de uma floresta tropical, fantasia sombria, cores vibrantes, pinceladas, alta qualidade, grau de cor melancólico.

Resultado Dall-E2

Resultado de difusão estável

Exemplo 3

No prompt a seguir, adicionamos algumas palavras abstratas para verificar o potencial criativo de ambos os geradores de imagens:

Desenho realista de um professor astrofísico masculino explicando a gravidade para seus alunos da Universidade de Oxford, cores vibrantes, estrelas, galáxias, o universo e a academia escura.

Resultado Dall-E2

Resultado de difusão estável

Conclusão

Apresentamos imagens geradas por Dall-E2 e Stable Diffusion para 3 prompts de usuário personalizados. Ambas as plataformas de geração de imagens baseadas em IA produziram imagens de qualidade com algumas semelhanças e diferenças particulares. Deixaremos o julgamento para você decidir quais criações se encaixam no seu estilo e se você deve usar a plataforma Stable Diffusion gratuita ou assinar o gerador de imagens Dall-E2.