Midjourney v5 já está disponível – aqui está o que há de novo em comparação com a v4

Midjourney v5 já está disponível. O novo modelo pode gerar imagens muito mais realistas e detalhadas, mas também requer comandos mais precisos.

O novo modelo foi treinado em um “Superaglomerado de IA” no Google Cloud e estava em desenvolvimento há cerca de cinco meses, de acordo com Midjourney. Ele usa uma arquitetura neural significativamente modificada e novas técnicas estéticas. Em particular, o modelo pode produzir imagens mais realistas e mais detalhes com maior probabilidade de estarem corretos.

Isso pode ser visto em um primeiro teste: os mesmos prompts sem um estilo de imagem explícito resultaram em imagens significativamente mais realistas com mais detalhes. Por exemplo, aqui está uma comparação do prompt “uma árvore feita de dinheiro”onde Midjourney v4 produz uma ilustração, enquanto v5 prefere uma instalação mais fotorrealista em um museu. O resultado v5 também está muito mais próximo do que o prompt pretendia.

Retratos de pessoas famosas também parecem mais realistas e têm menos erros de imagem. Aqui está uma comparação entre v4 e v5 para o prompt: “AppleCEO Tim Cook usando headset VR fechado com frente opaca e Applelogotipo nele, arte digital”.

1678967239 956 Midjourney v5 ja esta disponivel aqui esta o que
1678967239 547 Midjourney v5 ja esta disponivel aqui esta o que

O prompt “A grande entrada envidraçada de um grande edifício corporativo, um grande jorro de tinta verde derramando pela porta da frente para a rua” leva a uma renderização realista, mas mais ilustrativa no V4, enquanto o v5 gera imagens fotorrealistas mesmo sem um prompt de foto explícito.

1678967239 569 Midjourney v5 ja esta disponivel aqui esta o que
1678967239 564 Midjourney v5 ja esta disponivel aqui esta o que

As mãos ainda podem ser renderizadas incorretamente, mas no geral as extremidades são renderizadas com mais precisão do que na v4.

MJ5 como “modo profissional” para motivos mais realistas

O fundador da Midjourney, David Holz, refere-se ao V5 como o “modo profissional” porque, em contraste com seus predecessores, é menos limitado a estilos artísticos específicos e oferece uma maior variedade de resultados de imagem.

Em outras palavras, oferece mais latitude criativa, mas essa latitude deve ser dominada. De acordo com Holz, isso pode exigir prompts mais longos que descrevam mais explicitamente os detalhes da imagem, como iluminação e clima, para alcançar o resultado desejado.

O atual modelo v5 ainda é uma versão alfa que passará por “mudanças significativas” antes do lançamento final, de acordo com Holz. A versão final, como os modelos anteriores, terá um estilo padrão mais amigável para iniciantes. Portanto, os criativos não devem contar com a disponibilidade do estilo v5 atual para o trabalho de acompanhamento.

Para executar v5, você deve alterar Midjourney para “MJ v5” nas configurações do Discord ou adicionar o parâmetro “–v 5” ao prompt. A saída está diretamente no dobro da resolução da v4, o upscaling ainda não está disponível.