O fundador da Midjourney, David Holz, fala sobre o impacto da IA ​​na arte, na imaginação e na economia criativa

Meio da jornada é um dos principais impulsionadores da tecnologia emergente de uso de inteligência artificial (IA) para criar imagens visuais a partir de prompts de texto. A startup sediada em São Francisco recentemente foi notícia como o motor por trás da obra de arte que ganhou um prêmio em uma competição da feira estadual do Colorado, e é improvável que seja a última questão complicada que a arte da IA ​​enfrentará nos próximos anos.

Midjourney se diferencia dos demais no espaço ao enfatizar a estética pictórica nas imagens que produz. A plataforma não está tentando criar imagens fotorrealistas que possam ser confundidas com fotografias, e o CEO David Holz diz que está pessoalmente muito desconfortável com a qualidade estranha de deepfakes e outros trabalhos que simulam a realidade muito de perto. Em vez disso, Holz diz que Midjourney foi projetado para liberar a criatividade das pessoas comuns, dando-lhes ferramentas para fazer belas fotos apenas descrevendo-as.

Mas, apesar do foco humanista e orientado para o consumidor da empresa, há questões inevitáveis ​​sobre as implicações para a arte comercial e artistas profissionais. Eu entrevistei Holz para um peça mais ampla sobre as possíveis interrupções que a arte da IA ​​provavelmente causará na produção de imagens para entretenimento, videogames e publicações. Aqui está um trecho mais longo de nossa conversa, onde Holz fornece mais profundidade e contexto à medida que aborda essas questões e expõe sua visão para a empresa, o setor e a tecnologia. A entrevista foi editada para maior extensão e clareza.

Rob Salkowitz, Colaborador da Forbes: Qual é o seu papel e título?

David Holz, meio da jornada. Eu sou o fundador e CEO. Eu geralmente prefiro ser chamado de fundador, no entanto, porque CEO parece muito empresarial, e nós não somos muito empresariais. Somos um laboratório de pesquisa aplicada que fabrica produtos.

Qual é a missão do Midjourney?

Gostamos de dizer que estamos tentando expandir os poderes imaginativos da espécie humana. O objetivo é tornar os humanos mais imaginativos, não fazer máquinas imaginativas, o que eu acho que é uma distinção importante.

Você pode dar um breve histórico da empresa até hoje?

Começamos a trabalhar na parte de imaginação da nossa empresa há cerca de um ano e meio. Houve alguns avanços em modelos de difusão, pessoas entendendo clipe, openAI, esse tipo de coisa. Quase todo mundo envolvido nisso é São Francisco e todos nós percebemos que isso vai ficar sério, que é diferente de muitas outras coisas.

O que a Midjourney vê como benefício dessa tecnologia de texto para imagem para os negócios e a sociedade?

Estou definitivamente mais preocupado com a sociedade do que com os negócios. Somos um produto de consumo, mas talvez 30% a 50% de nossos usuários no momento sejam profissionais. A maioria não. Artistas na plataforma nos dizem que isso permite que eles sejam mais criativos e exploradores no começo, tendo muitas ideias em um curto espaço de tempo.

No momento, nossos usuários profissionais estão usando a plataforma para concepção. A parte mais difícil de [um projeto de arte comercial] geralmente é no início, quando o stakeholder não sabe o que quer e precisa ver algumas ideias para reagir. Midjourney pode ajudar as pessoas a convergir para a ideia que desejam muito mais rapidamente, porque iterar nesses conceitos é muito trabalhoso.

Outra vantagem para os artistas é que dá confiança às pessoas em áreas nas quais não confiam. A maioria, se não todos os artistas, sentem que há alguma parte da arte que não podem fazer bem. Pode ser cores, composição, fundos. Temos um designer de personagens famoso usando nosso produto e as pessoas perguntam a ele por que você usaria uma IA, já que você já é tão bom. E ele disse, “bem, eu só sou bom na parte do personagem. Isso está me ajudando com o resto, o mundo, o plano de fundo, os esquemas de cores.”

Cerca de quantas pessoas estão usando o produto?

Milhões estão usando. Nosso Discord é superior a dois milhões. É o maior servidor Discord ativo de longe agora.

A licença da Midjourney permite o uso comercial das imagens geradas pela plataforma?

Sim. Mas se você estiver trabalhando para uma empresa com mais de um milhão de dólares em receita anual, pedimos que você compre uma licença corporativa.

Como o conjunto de dados foi construído?

É apenas um grande arranhão da Internet. Usamos os conjuntos de dados abertos que são publicados e treinamos neles. E eu diria que isso é algo que 100% das pessoas fazem. Não fomos exigentes. A ciência está realmente evoluindo rapidamente em termos de quantos dados você realmente precisa, versus a qualidade do modelo. Vai levar alguns anos para realmente descobrir as coisas e, nessa época, você pode ter modelos que treina com quase nada. Ninguém sabe realmente o que pode fazer.

Você buscou o consentimento de artistas vivos ou trabalho ainda sob direitos autorais?

Não. Não há realmente uma maneira de obter cem milhões de imagens e saber de onde elas vêm. Seria legal se as imagens tivessem metadados embutidos sobre o proprietário dos direitos autorais ou algo assim. Mas isso não é uma coisa; não há um registro. Não há como encontrar uma imagem na Internet e rastreá-la automaticamente até o proprietário e ter qualquer maneira de fazer qualquer coisa para autenticá-la.

Os artistas podem optar por não serem incluídos em seu modelo de treinamento de dados?

Estamos olhando para isso. O desafio agora é descobrir quais são as regras e como descobrir se uma pessoa é realmente o artista de uma determinada obra ou apenas colocando seu nome nela. Não encontramos ninguém que queira que seu nome seja retirado do conjunto de dados.

Os artistas podem optar por não serem nomeados nos prompts?

Não agora. Estamos olhando para isso. Novamente, teríamos que encontrar uma maneira de autenticar essas solicitações, o que pode ser complicado.

O que você diz aos artistas comerciais preocupados que isso destruirá seus meios de subsistência? A certa altura, por que um diretor de arte contrataria um ilustrador para produzir trabalhos como arte conceitual, design de produção, planos de fundo – esse tipo de coisa – quando eles podem simplesmente inserir prompts e obter resultados úteis muito mais rapidamente e a um custo muito menor?

É muito trabalho ainda. Não é apenas como “faça-me um plano de fundo”. Pode ser dez vezes menos trabalho, mas é muito mais trabalho do que um gerente pode fazer.

Acho que há dois caminhos para isso. Uma forma é tentar fornecer o mesmo nível de conteúdo que as pessoas consomem por um preço menor, certo? E a outra maneira de fazer isso é criar conteúdo muito melhor a preços que já estamos dispostos a gastar. Acho que a maioria das pessoas, se já está gastando dinheiro, e você tem a escolha entre conteúdo muito melhor ou conteúdo mais barato, na verdade escolhe conteúdo muito melhor. O mercado já estabeleceu um preço que as pessoas estão dispostas a pagar.

Eu acho que algumas pessoas vão tentar cortar os artistas. Eles vão tentar fazer algo parecido com um custo menor, e acho que vão falhar no mercado. Acho que o mercado irá em direção a maior qualidade, mais criatividade e conteúdo muito mais sofisticado, diversificado e profundo. E as pessoas que realmente são capazes de usar como os artistas e usam as ferramentas para fazer isso são as que vão ganhar.

Essas tecnologias realmente criam uma apreciação e alfabetização muito mais profunda no meio visual. Você pode realmente ter a demanda, superar a capacidade de produzir nesse nível, e então talvez você esteja aumentando os salários dos artistas. Pode ser estranho, mas é isso que vai acontecer. O ritmo desse aumento de demanda por qualidade e diversidade levará à realização de alguns projetos maravilhosos e inesperados.

Uma geração de estudantes se formou em escolas de arte, muitos deles endividados, contando com empregos relativamente bem pagos em produção de entretenimento, produção de videogame, arte comercial e assim por diante. Como o surgimento de plataformas de texto para imagem de IA afeta seu futuro?

Acho que algumas pessoas tentarão cortar custos e outras tentarão expandir as ambições. Acho que as pessoas que expandem as ambições ainda estarão pagando todos os mesmos salários, e as pessoas que tentam cortar custos, acho, falharão.

Ai é normalmente usado em escala para coisas como call centers ou despachar malas em aeroportos e o tipo de trabalho que as pessoas realmente não se importam em fazer. E a proposta de valor é liberar as pessoas para fazer tipos de trabalho mais gratificantes e interessantes. Mas os trabalhos artísticos são gratificantes e interessantes. As pessoas trabalham a vida inteira e desenvolvem suas habilidades para conseguir esse tipo de emprego. Por que você apontaria essa tecnologia para esse nível da economia como uma espécie de foco de negócios e prioridade para as coisas que você está fazendo?

Pessoalmente, não estou. Meu material não é feito para artistas profissionais. Se eles gostam de usá-lo, então isso é ótimo. Minhas coisas são feitas para pessoas que, tipo, há uma mulher em Hong Kong, e ela veio até mim e disse: “A única coisa em Hong Kong que seus pais nunca querem que você seja é uma artista, e eu” sou um banqueiro agora. Estou vivendo uma boa vida de banqueiro. Mas com Midjourney agora estou começando a sentir o gostinho dessa experiência de ser a pessoa que eu realmente queria ser.” Ou um cara na parada de caminhões que está fazendo seus próprios cartões de beisebol com imagens selvagens, apenas por diversão. É feito para essas pessoas, porque, como a maioria das pessoas, elas nunca conseguem fazer essas coisas.

É importante enfatizar que não se trata de arte. Isso é sobre imaginação. A imaginação às vezes é usada para a arte, mas muitas vezes não é. A maioria das imagens criadas no Midjourney não estão sendo usadas profissionalmente. Eles nem estão sendo compartilhados. Eles estão apenas sendo usados ​​para esses outros propósitos, essas necessidades muito humanas.

No entanto, a saída do seu produto é a imagem, que tem valor comercial no contexto profissional, além de todas essas outras propriedades. E isso é muito disruptivo para essa economia.

Eu acho que é como se estivéssemos fazendo um barco, e alguém pode correr com o barco, mas isso não significa que o barco é sobre corridas. Se você usa o barco para correr, talvez goste, sim, claro. Nesse momento é. Mas o lado humano realmente importa, e acho que não somos… Queremos fazer as fotos ficarem bonitas. Não nos vemos tentando criar arte como parte de nossa coisa. Queremos que o mundo seja mais imaginativo. Preferimos fazer coisas bonitas do que coisas feias.

Você acredita que algum órgão governamental tem jurisdição ou autoridade para regular essa tecnologia? E se sim, você acha que deveriam?

Não sei. A regulamentação é interessante. Você tem que equilibrar a liberdade de fazer algo com a liberdade de ser protegido. A tecnologia em si não é o problema. É como a água. A água pode ser perigosa, você pode se afogar nela. Mas também é essencial. Não queremos proibir a água apenas para evitar as partes perigosas.

Bem, queremos ter certeza de que nossa água está limpa.

Sim, é verdade.

Fonte: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- economia criativa/