Sumário
Nos últimos três anos, vimos avanços notáveis em Inteligência Artificial para texto e imagens. Qual é a próxima etapa?
Além da impressionante IA de imagem da OpenAI DALL-E 2 , Midjourney também está fazendo sucesso. O sistema de IA baseado em Discord não atinge a consistência e os detalhes do DALL-E 2 e certamente não sua capacidade de fotorrealismo . Pode, no entanto, produzir motivos artísticos atraentes para o qual o modelo é otimizado. Midjourney está disponível em beta aberto há alguns dias .
IA para todos? “Não há computadores suficientes”
David Holz (fundador da Leap Motion, agora Ultraleap) é CEO da Midjourney, que Holz diz ter atualmente vários 100.000 clientes gerando milhões de imagens por dia em cerca de 10.000 servidores. Apesar do enorme tamanho do projeto, a Midjourney atualmente tem apenas cerca de dez funcionários.
Cerca de um milhão de usuários estão ativos no servidor Discord do Midjourney sozinho. Essa comunidade faz parte do conceito – em um coletivo vocês são mais criativos e podem inspirar uns aos outros, explica Holz.
Segundo Holz, são necessários “milhares de trilhões de operações” por imagem, um esforço computacional sem precedentes para um serviço online. Uma execução de treinamento para a IA de imagem custa cerca de 50.000, de acordo com Holz, e várias execuções (“3 a 20”) são necessárias por processo de treinamento até que o modelo esteja pronto.
Apesar desses altos custos de computação, a Midjourney já é lucrativa, de acordo com Holz. O start-up é financiado de forma independente; os investidores não estão envolvidos.
Entretanto, se dez milhões de pessoas quisessem usar uma tecnologia como a Midjourney, “na verdade não haveria computadores suficientes”, diz Holz. “Não há um milhão de servidores gratuitos para fazer IA no mundo. Acho que o mundo ficará sem computadores antes que a tecnologia realmente chegue a todos que desejam usá-la.”
Conteúdo de IA em tempo real em breve – mas será caro
Holz espera que a mídia gerada por IA continue progredindo rapidamente. Em dois anos, deve ser possível gere conteúdo em tempo real a 30 quadros por segundo em alta resolução.
“Será caro, mas será possível”, diz Holz. O primeiro passo nessa direção é Apple GAUDI AI recentemente revelado , que gera cenas 3D interativas a partir de frases. Em dez anos, haverá um Xbox com um processador AI que sonha todos os jogos em tempo real, acredita Holz.
“Do ponto de vista da tecnologia bruta, esses são apenas fatos, e não há como contornar isso. Mas do ponto de vista humano, o que diabos isso significa? Todos os jogos são sonhos, e tudo é maleável, e vamos ter AR fones de ouvido “- o que diabos isso significa? Portanto, o elemento humanístico disso é insondável”, diz Holz.
O software para esse futuro de IA, que Holz diz que ainda está “completamente fora do mapa” hoje, é um dos principais focos de sua startup.