Sumário
Meta demonstra um sistema de IA projetado para dar às pessoas mais controle sobre sua arte de IA. Sistemas como este também podem ser uma ferramenta para ajudar a construir o Metaverso.
Imagens geradas por IA circulam na web há anos. Enquanto alguns anos atrás eram principalmente sistemas baseados em GAN que geravam gatos ou pessoas enganosamente reais, hoje são os modelos multimodais que permitem criações direcionadas por meio de entrada de texto. Usuários de DALL-E 2 meio da jornada e Craiyon (anteriormente DALL-E mini) estão inundando o Twitter, Instagram e outros canais com imagens de IA.
No entanto, o controle concreto sobre esses sistemas geralmente é bastante limitado: insira o texto e aguarde as imagens – é isso. Com alguns sistemas, variantes de resultados interessantes podem ser geradas. A criatividade do DALL-E também pode ser direcionada especificamente para locais individuais em uma imagem existente para alterar esta seção. Então, por exemplo, um flamingo aparece no que na verdade é uma piscina vazia.
Experimentos de meta com texto mais esboço
Em um novo artigo, os pesquisadores da Meta agora demonstram um sistema de IA multimodal que permite a geração de imagens mais direcionadas. Os usuários podem alimentar o “Make-A-Scene” com um esboço e, em seguida, iniciar o processo de geração inserindo texto adicional.
Enquanto com outros sistemas de IA os resultados costumam ser difíceis de prever, o Make-A-Scene permite que as pessoas direcionem suas ideias com mais precisão, escreve Meta.
Vídeo: meta
Isso requer a definição do layout básico da cena no esboço. A entrada de texto preenche o esboço com gráficos gerados por IA. O modelo também pode criar seus próprios layouts por meio de entrada de texto – no entanto, os usuários perdem algum controle dessa maneira.
A Meta vê o Make-A-Scene como um passo em direção à criação de IA mais direcionada
De acordo com a Meta, alguns artistas receberam acesso de teste ao Make-A-Scene. Um dos desenvolvedores testou o sistema com seus filhos, por exemplo, para fazer monstros ursos andarem em trens. Não há planos de lançá-lo por enquanto: para Meta, Make-A-Scene é um experimento em criatividade de IA que se concentra no controle do usuário.
Para aproveitar o potencial da IA para promover a expressão criativa, os humanos devem ser capazes de moldar e controlar o conteúdo gerado pelo sistema, escreve Meta. Para fazer isso, um sistema adequado deve ser intuitivo e fácil de usar – usando fala, texto, esboços, gestos ou mesmo movimentos oculares.
Graças ao suporte de IA, Meta espera criar uma nova classe de ferramentas criativas que permitirá que muitas pessoas criem mensagens expressivas em 2D, XR e mundos virtuais.