Uma olhada no novo Al Generative Art

Al arte generativa é um tipo de arte, na maioria das vezes visual, que se baseia na cooperação entre um ser humano e um sistema autônomo. Um “sistema autônomo” é definido como um Inteligência artificial software, algoritmo ou modelo capaz de realizar operações complexas sem a necessidade de intervenção do programador.

Das bizarras justaposições de imagens criadas por Dall-E Mini ao NFT mercado, as imagens geradas por algoritmos de IA estão cada vez mais entrando na imaginação do mainstream. De fato, dois importantes projetos sobre o assunto que merecem ser analisados ​​são: Meio da jornada e DALL-E2.

Claro, a notícia também chegou ao Twitter. Comentando sobre isso, entre outros, está Charles Hoskinson, que escreveu:

Al Generative Art: primeiros experimentos e recursos

Tendo entendido o que é Arte Generativa, é importante enfatizar um de seus princípios fundadores: aleatoriedade. O que é uma propriedade fundamental da Arte Generativa.

De fato, dependendo do tipo de software, o sistema autônomo é capaz de processar resultados sempre diferentes e únicos cada vez que o comando de geração é executado, ou pode retornar um número variável de resultados em resposta à entrada do usuário.

As primeiras experiências em Arte Generativa datam da década de 1960 com os experimentos de Haroldo Cohen e sua AARON programa. Cohen usou pela primeira vez um software autônomo para gerar obras de arte abstratas inspiradas nas serigrafias da Pop Art. As obras de Cohen estão agora em exibição na Tate Gallery, em Londres.

Outro atributo da Arte Generativa, mas cada vez menos uma prerrogativa, é a repetição de padrões ou elementos abstratos fornecidos pelo programador e implementados no código do software.

Além disso, o desenvolvimento de redes neurais cada vez mais complexas operando na associação texto-imagem permitiu o desenvolvimento de modelos generativos capazes de criar imagens cada vez mais realistas e precisas. O exemplo mais conhecido desta categoria de arte generativa é Laje.

Dall-E é uma rede neural multimodal baseada no GPT-3 modelo de aprendizagem profunda de OpenAI, a mesma empresa que também desenvolveu recentemente ChatGPT, o chatbot lançado em novembro de 2022 e otimizado com “supervisionado” e técnicas de aprendizado por reforço.

Voltando ao Dall-E, vemos que esse sistema é capaz de gerar imagens a partir de uma descrição textual, chamada de "pronto," com base em um conjunto de dados de pares texto-imagem.

A primeira versão do Dall-E, que foi apresentada ao público em janeiro de 2021 e permaneceu como prerrogativa de um pequeno número de profissionais da área, representou uma verdadeira revolução em termos desse tipo de modelo generativo, superando as inovações do GPT- 3 em si.

Também é significativo o fato de que a precisão dos resultados processados ​​pelo Dall-E provou ser o escopo perfeito para outra solução OpenAI: CLIP (Pré-treinamento Linguagem-Imagem Contrastiva).

Uma rede neural de classificação e classificação de imagens treinada com base em associações texto-imagem, como legendas encontradas na Internet. Graças à intervenção do CLIP, que reduz o número de resultados propostos ao usuário por prompt para 32, o Dall-E apresentou imagens satisfatórias na maioria dos casos.

Midjourney: design, infraestrutura humana e inteligência artificial

Como previsto, Meio da jornada é um projeto importante que faz parte do conceito emergente Al Generative Art. Especificamente, Midjourney é um laboratório de pesquisa independente que explora novos meios de pensar e expande os poderes imaginativos da espécie humana.

A utilização é simples: primeiro deve ser criada uma conta no Discord, uma plataforma que hospeda várias comunidades, sendo a Midjourney uma delas. Dentro do aplicativo estão as diversas salas de bate-papo nas quais se pode participar ativamente ou não das discussões.

É importante ressaltar que para tentar usar a Inteligência Artificial pela primeira vez é preciso ir ao "novatos" canais, onde 25 renderizações gratuitas estão disponíveis.

Uma renderização corresponde à geração de quatro variantes diferentes geradas a partir da mesma entrada textual.

Assim, as 25 renderizações referem-se a 25 jobs de processamento executados pelo bot Midjourney. Consequentemente, gerar a imagem requer interagir com o bot Midjourney por meio de uma mensagem de texto chamada “prompt”, na qual haverá palavras-chave descrevendo a imagem que o usuário tem em mente.

Você pode adicionar quantos detalhes quiser, o importante é dividir as palavras-chave com vírgula. Depois que a renderização é concluída, o computador retorna quatro imagens diferentes com base nas descrições para escolher.

Além disso, assim que o programa terminar de renderizar, você pode comunicar suas preferências com base nas imagens e, se desejar, gerar novamente mais quatro versões.

DALL-E 2: o novo sistema de IA para obras de arte

Além do Midjourney, o DALL-E 2 também é o novo sistema de IA que pode criar imagens e obras de arte realistas a partir de uma descrição em linguagem natural. Além disso, o DALL-E 2 também pode combinar conceitos, atributos e estilos.

A força do novo sistema de IA também reside na capacidade de expandir as imagens além do que está na tela original, criando novas composições expansivas. Além disso, pode fazer alterações realistas em imagens existentes a partir de uma legenda em linguagem natural e pode adicionar e remover elementos levando em consideração sombras, reflexos e texturas.

Os recursos do DALL-E 2 também incluem tirar uma imagem e criar diversas variações inspiradas no original. DALL-E 2 aprendeu a relação entre as imagens e o texto usado para descrevê-las.

Ele usa um processo chamado "difusão," que começa com um padrão de pontos aleatórios e gradualmente altera esse padrão em direção a uma imagem quando reconhece aspectos específicos dessa imagem.

Assim, depois que a OpenAI introduziu o DALL-E em janeiro de 2021, agora o mais novo sistema, DALL-E 2, gera imagens mais realistas e precisas com resolução quatro vezes maior.

O DALL-E 2 começou como um projeto de pesquisa e agora está disponível como um versão beta. Mitigações de segurança que o sistema desenvolveu e continua a melhorar incluem: limitar a capacidade do sistema de gerar imagens violentas, de ódio ou adultas e implantação em fases baseada em aprendizado.

Fonte: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/