É verdade que o Generative AI ChatGPT inundará a Internet com conteúdo infinito, pergunta a ética da IA ​​e a lei da IA

Você por acaso conhece o inspirador livro infantil Um peixe fora da água?

O livro encantador foi escrito por Helen Palmer (nome verdadeiro Helen Palmer Geisel) e foi baseado em um conto do Dr. Seuss (nome verdadeiro Theodor Geisel). A equipe de marido e mulher produziu uma contribuição lendária para a literatura infantil, encantando os jovens em todos os lugares.

Caso você não esteja familiarizado com o enredo ou precise de uma atualização, permita-me resumir brevemente. Um menino compra um peixinho dourado em sua loja de animais local. Ele é severamente instruído a nunca alimentar demais a pequena criatura marinha. Você nunca sabe o que pode acontecer se você fizer isso.

O menino inadvertidamente superalimenta seu peixinho dourado, apenas uma vez, mas isso desencadeia uma quantidade impressionante de crescimento desenfreado.

As coisas começam a dar errado.

O outrora minúsculo peixe rapidamente supera seu aquário e fica tão grande que o menino coloca o amado animal de estimação em uma banheira dentro de casa. O peixe continua crescendo e crescendo. Isso parece ser imparável.

Logo, a polícia e o corpo de bombeiros vêm em socorro do menino e transportam o peixinho dourado, agora do tamanho de um elefante, para a piscina pública local. No final das contas, o dono da loja de animais chega e consegue encolher o peixinho dourado de volta ao tamanho normal. Não sabemos como esse feito mágico foi alcançado. O menino é advertido novamente para evitar superalimentação.

Lição aprendida, da maneira mais difícil.

Talvez precisemos prestar atenção a essa mesma lição angustiante quando se trata do futuro da Internet.

Como eu sei?

A realidade de hoje é que podemos ter inventado uma forma de Inteligência Artificial (IA) que vai se expandir e encher a Internet com uma torrente massiva e interminável de dados. Há muito aperto de mão que IA generativa, a IA mais quente nas notícias atualmente, fará exatamente isso.

A IA generativa é capaz de gerar ou produzir saídas, como texto, com apenas um simples prompt inserido por um usuário humano. Um ensaio completo e extenso pode ser gerado por meio de algumas palavras bem escolhidas. Você pode estar ciente da IA ​​generativa devido a um aplicativo de IA amplamente popular conhecido como ChatGPT, lançado em novembro pela OpenAI. Eu estarei falando mais sobre isso momentaneamente.

Alguns têm alertado veementemente que a IA generativa pode ser usada para criar uma quantidade aparentemente infinita de conteúdo.

Uma pessoa pode facilmente aproveitar a IA generativa para produzir muitos milhares de ensaios em apenas uma única sessão online, fazendo isso com o mínimo de trabalho de sua parte. A pessoa poderia então optar por postar os ensaios gerados na Internet. Imagine isso feito em escala. Em essência, vá em frente e multiplique isso pelos milhões e milhões de usuários da Internet. Um verdadeiro tsunami de conteúdo gerado pode ser prontamente produzido e postado.

Enxágue, repita, fazendo isso incessantemente, dia após dia, minuto a minuto.

Esta é uma afirmação nervosa do céu está caindo ou tem mérito válido?

Na coluna de hoje, abordarei essas preocupações expressas de que estamos enfrentando um futuro de uma Internet completamente obstruída e inundada por conteúdo generativo de IA. Examinaremos a base para essas dúvidas e consideraremos algumas vantagens potenciais que geralmente não são declaradas. Estarei me referindo ocasionalmente ao ChatGPT durante esta discussão, pois é o gorila de 600 libras da IA ​​generativa, embora tenha em mente que existem muitos outros aplicativos de IA generativa e geralmente são baseados nos mesmos princípios gerais.

Enquanto isso, você pode estar se perguntando o que de fato é a IA generativa.

Vamos primeiro cobrir os fundamentos da IA ​​generativa e, em seguida, podemos dar uma olhada no assunto urgente em questão.

Em tudo isso, há uma série de considerações sobre a ética da IA ​​e a lei da IA.

Esteja ciente de que há esforços contínuos para imbuir os princípios éticos da IA ​​no desenvolvimento e no uso de aplicativos de IA. Um contingente crescente de preocupados e antigos éticos da IA ​​está tentando garantir que os esforços para conceber e adotar a IA levem em consideração uma visão de fazer AI For Good e evitando AI para mau. Da mesma forma, há propostas de novas leis de IA que estão sendo cogitadas como possíveis soluções para impedir que os empreendimentos de IA enlouqueçam com os direitos humanos e coisas do gênero. Para minha cobertura contínua e extensa de Ética e Lei de IA, consulte o link aqui e o link aqui, Apenas para nomear alguns.

O desenvolvimento e a promulgação dos preceitos de IA ética estão sendo buscados para evitar que a sociedade caia em uma miríade de armadilhas indutoras de IA. Para minha cobertura dos princípios de Ética da IA ​​da ONU, elaborados e apoiados por quase 200 países por meio dos esforços da UNESCO, consulte o link aqui. Na mesma linha, novas leis de IA estão sendo exploradas para tentar manter a IA em equilíbrio. Uma das últimas tomadas consiste em um conjunto de Declaração de Direitos da IA que a Casa Branca dos EUA divulgou recentemente para identificar os direitos humanos na era da IA, consulte o link aqui. É preciso uma aldeia para manter a IA e os desenvolvedores de IA no caminho correto e impedir os esforços dissimulados propositais ou acidentais que podem minar a sociedade.

Estarei entrelaçando as considerações relacionadas à ética da IA ​​e à lei da IA ​​nesta discussão.

Fundamentos da IA ​​generativa

A instância mais conhecida de IA generativa é representada por um aplicativo de IA chamado ChatGPT. O ChatGPT surgiu na consciência pública em novembro, quando foi lançado pela empresa de pesquisa de IA OpenAI. Desde então, o ChatGPT conquistou manchetes enormes e surpreendentemente excedeu seus quinze minutos de fama.

Suponho que você provavelmente já ouviu falar do ChatGPT ou talvez até conheça alguém que o tenha usado.

O ChatGPT é considerado um aplicativo de IA generativo porque recebe como entrada algum texto de um usuário e, em seguida, gera ou produz uma saída que consiste em um ensaio. A IA é um gerador de texto para texto, embora eu descreva a IA como sendo um gerador de texto para ensaio, pois isso esclarece mais prontamente para o que é comumente usado. Você pode usar IA generativa para compor composições longas ou fazer comentários concisos bastante curtos. Tudo depende de você.

Tudo o que você precisa fazer é inserir um prompt e o aplicativo AI gerará para você um ensaio que tenta responder ao seu prompt. O texto composto parecerá que o ensaio foi escrito pela mão e pela mente humana. Se você inserir um prompt que diga “Fale-me sobre Abraham Lincoln”, a IA generativa fornecerá a você um ensaio sobre Lincoln. Existem outros modos de IA generativa, como text-to-art e text-to-video. Vou me concentrar aqui na variação de texto para texto.

Seu primeiro pensamento pode ser que essa capacidade generativa não pareça grande coisa em termos de produção de ensaios. Você pode facilmente fazer uma pesquisa on-line na Internet e encontrar prontamente toneladas e toneladas de ensaios sobre o presidente Lincoln. O kicker no caso da IA ​​generativa é que o ensaio gerado é relativamente único e fornece uma composição original em vez de um imitador. Se você tentasse encontrar o ensaio produzido pela IA online em algum lugar, dificilmente o descobriria.

A IA generativa é pré-treinada e faz uso de uma formulação matemática e computacional complexa que foi criada examinando padrões em palavras escritas e histórias na web. Como resultado do exame de milhares e milhões de passagens escritas, a IA pode produzir novos ensaios e histórias que são uma mistura do que foi encontrado. Ao adicionar várias funcionalidades probabilísticas, o texto resultante é praticamente único em comparação com o que foi usado no conjunto de treinamento.

Existem inúmeras preocupações sobre IA generativa.

Uma desvantagem crucial é que os ensaios produzidos por um aplicativo de IA baseado em geração podem conter várias falsidades incorporadas, incluindo fatos manifestamente falsos, fatos que são retratados de forma enganosa e fatos aparentes totalmente fabricados. Esses aspectos fabricados são muitas vezes referidos como uma forma de alucinações de IA, uma frase de efeito que eu desaprovo, mas lamentavelmente parece estar ganhando força popular de qualquer maneira (para minha explicação detalhada sobre por que essa é uma terminologia ruim e inadequada, veja minha cobertura em o link aqui).

Outra preocupação é que os humanos podem facilmente assumir o crédito por um ensaio generativo produzido por IA, apesar de não terem escrito o ensaio por conta própria. Você deve ter ouvido falar que professores e escolas estão bastante preocupados com o surgimento de aplicativos generativos de IA. Os alunos podem usar a IA generativa para escrever suas redações atribuídas. Se um aluno afirma que um ensaio foi escrito por sua própria mão, há poucas chances de o professor ser capaz de discernir se ele foi forjado por IA generativa. Para minha análise dessa faceta que confunde alunos e professores, veja minha cobertura em o link aqui e o link aqui.

Houve algumas reivindicações descomunais nas mídias sociais sobre IA generativa afirmando que esta versão mais recente da IA ​​é de fato IA senciente (não, eles estão errados!). Aqueles em AI Ethics e AI Law estão notavelmente preocupados com essa tendência crescente de reivindicações estendidas. Você pode dizer educadamente que algumas pessoas estão exagerando o que a IA de hoje pode realmente fazer. Eles assumem que a IA tem capacidades que ainda não conseguimos alcançar. Isso é lamentável. Pior ainda, eles podem permitir a si mesmos e a outros entrar em situações terríveis por causa da suposição de que a IA será senciente ou semelhante à humana ao ser capaz de agir.

Não antropomorfize a IA.

Fazer isso o deixará preso em uma armadilha de confiança pegajosa e obstinada de esperar que a IA faça coisas que ela é incapaz de realizar. Com isso dito, o que há de mais recente em IA generativa é relativamente impressionante pelo que pode fazer. Esteja ciente, porém, de que existem limitações significativas que você deve ter sempre em mente ao usar qualquer aplicativo de IA generativo.

Um último aviso por enquanto.

Tudo o que você vê ou lê em uma resposta de IA generativa que parece para ser transmitido como puramente factual (datas, lugares, pessoas, etc.), certifique-se de permanecer cético e estar disposto a verificar novamente o que você vê.

Sim, as datas podem ser inventadas, os lugares podem ser inventados e os elementos que normalmente esperamos serem irrepreensíveis são todos os sujeito a suspeitas. Não acredite no que você lê e mantenha um olhar cético ao examinar quaisquer ensaios ou saídas generativas de IA. Se um aplicativo de IA generativo disser que Abraham Lincoln voou pelo país em seu jato particular, você sem dúvida saberia que isso é uma loucura. Infelizmente, algumas pessoas podem não perceber que os jatos não existiam em sua época, ou podem saber, mas não perceber que o ensaio faz essa afirmação descarada e escandalosamente falsa.

Uma forte dose de ceticismo saudável e uma mentalidade persistente de descrença serão seu melhor trunfo ao usar IA generativa.

Estamos prontos para passar para o próximo estágio desta elucidação.

Olhando para o que a IA generativa pode fazer com a Internet

Agora que você tem uma aparência do que é IA generativa, podemos explorar a questão irritante de saber se esse tipo de IA vai causar caos e tumulto por meio do inchaço da Internet.

Aqui estão meus oito tópicos vitais pertinentes a este assunto:

  • 1) Tamanho da Internet
  • 2) Indexação da Internet
  • 3) Avaliando o que é conteúdo generativo produzido por IA
  • 4) O que há de errado com o conteúdo de IA generativa de qualquer maneira
  • 5) As pessoas postarão conteúdo de IA generativo na Internet
  • 6) Talvez as abordagens de paywall sejam reverenciadas
  • 7) A IA generativa do pântano multimodal aguarda
  • 8) Ciclos viciosos ou virtuosos de IA generativa

Abordarei cada um desses tópicos importantes e apresentarei as principais considerações sobre as quais todos devemos refletir atentamente. Cada um desses tópicos é parte integrante de um quebra-cabeça maior. Você não pode olhar para apenas uma peça. Nem você pode olhar para qualquer peça isoladamente das outras peças.

Este é um mosaico intrincado e todo o quebra-cabeça deve receber a devida consideração harmoniosa.

Tamanho da Internet

Um dos primeiros aspectos a serem considerados consiste no tamanho da Internet.

Isso é particularmente importante. A alegação que está sendo feita sobre a IA generativa é que aparentemente ela irá inchar enormemente a Internet. Teremos todo tipo de conteúdo adicionado devido à facilidade de empregar IA generativa para produzir grandes volumes de materiais digitais. Nesse caso, a questão logicamente sensata envolve o tamanho da Internet hoje, juntamente com o quanto a IA generativa pode produzir conteúdo adicional que, de outra forma, não estaria na Internet.

Tentar controlar o tamanho da Internet é, infelizmente, bastante difícil e imensamente impreciso.

Uma estimativa que foi postada em Finanças on-line sugere que a Internet atualmente tem pelo menos 74 zettabytes (ZB) de tamanho e atingirá potencialmente 463 ZB até o ano de 2025 (observe que o crescimento previsto não parece levar explicitamente em conta a IA generativa como um fator per se e apenas assume todos outra coisa é igual na derivação desta projeção).

Existem muitas outras estimativas do tamanho atual da Internet. Da mesma forma, existem muitas outras estimativas do crescimento esperado em tamanho. Não quero ficar atolado em discussões sobre esses números e estou apenas tentando enfatizar que a Internet é, sem dúvida, gigantesca em tamanho. Além disso, vale a pena notar que todas as expectativas razoáveis ​​são de que a Internet, no curso normal dos eventos, continuará descaradamente em seu caminho de crescimento vertiginoso.

Você também pode achar interessante que Statista postou várias estatísticas sugerindo que atualmente existem cerca de 5.16 bilhões de usuários da Internet. Isso é calculado como representando 64.4% da população global. Você está surpreso? Por um lado, podemos presumir naturalmente que a maioria das pessoas estaria de fato na Internet. Isso, porém, é um pouco distorcido da perspectiva de quem está de dentro, porque muitas pessoas não têm acesso imediato à Internet ou, de outra forma, não conseguem obter acesso. De qualquer forma, a expectativa é de que o acesso à Internet acabe ficando mais barato e seja ainda mais difundido, com isso o número de internautas certamente aumentará.

Estou arrastando você por essas estatísticas para nos levar a uma questão crucial.

Quanto a IA generativa acrescentará ao crescimento existente e contínuo da Internet?

É isso que queremos saber. Veja bem, a alegação sobre os impactos da IA ​​generativa parece considerar que, é claro, a IA generativa vai inundar a Internet. Tudo isso é um pouco de aceno de mão se você, convenientemente ou de forma distraída, evita discutir números reais e contagens verdadeiras de coisas.

Tomemos, por exemplo, a suposição geral de que a Internet tem cerca de 100 ZB de tamanho e está crescendo. Se você acredita que a IA generativa adicionará talvez 1 ZB por ano, isso é uma gota no balde da magnitude geral da Internet.

A IA generativa seria semelhante a jogar uma pedrinha em um vasto oceano.

Isso não parece se encaixar na narrativa predominante sobre este tópico importante. Alguns especularam apaixonadamente que podemos acabar com 10% da Internet sendo “normal” gerada pelo usuário e os 90% restantes serão devidos ao conteúdo generativo produzido por IA.

Não parece haver uma base sólida para essa afirmação, ela é aparentemente inventada do nada. Suponha de qualquer maneira que isso ocorreu. Se tomarmos os 100 ZB existentes como base e assumirmos que é essencialmente todo o conteúdo gerado pelo usuário (bem, isso é discutível), isso significa que teríamos que nos encontrar olhando para uma Internet do tamanho de 1,000 ZB. São 900 ZB de conteúdo generativo produzido por IA e 100 ZB de conteúdo gerado pelo usuário.

Teríamos pegado o oceano atual de presumido conteúdo manual e diminuído um pouco em comparação com a totalidade dos mares gerados pela IA da Internet.

Especulação sobre conjectura.

Então, qual será?

Teremos IA generativa produzindo uma pedra ou ela aumentará o tamanho da Internet várias vezes?

Ninguém pode dizer com certeza de qualquer maneira. Devemos explorar esses números-chave com seriedade, para que as discussões sobre o tema estejam enraizadas em algo tangível. Não fazer isso torna a conversa um pouco vazia e quase como o menino que gritou lobo.

Vamos considerar o próximo fator e tenha em mente que todos esses fatores estão inter-relacionados e devem ser considerados como um coletivo e não apenas individualmente.

Indexação da Internet

Você provavelmente percebe que, ao fazer uma pesquisa na Internet, está usando o mecanismo de pesquisa de alguém que tenta indexar rotineiramente o conteúdo da Internet. Aposto que você pode ter a impressão de que está obtendo acesso à preponderância da Internet quando usa um mecanismo de pesquisa popular.

Isso é altamente improvável.

Algumas estimativas são de que apenas uma fração da Internet foi indexada, talvez menos de 1% ou mais (alguns dizem que é de até 5% ou talvez um pouco mais alto; não está no nível que a maioria das pessoas geralmente supõe, como dizem 50% ou 90%). Novamente, esses números variam, mas ainda assim são relativamente pequenos. A essência é que você quase sempre desconhece uma grande parte da Internet.

Por que isso é significativo neste contexto?

Porque o conteúdo adicionado que a IA generativa presumivelmente produzirá estará potencialmente sujeito a uma consideração de indexação semelhante. Pode ser que quase nenhum conteúdo adicionado seja indexado. Nesse caso, você provavelmente nunca o verá.

O outro lado da moeda supõe que tal conteúdo “artificial” será indexado e feito para a lamentável falta de atenção ao conteúdo “convencional”. Um argumento é que os índices estarão preocupados com o conteúdo generativo de IA e negligenciarão o conteúdo convencional. Assim, mesmo que o conteúdo generativo de IA não esteja sobrecarregando a Internet, parece que é devido à indexação desproporcional de tal conteúdo.

No final, pode ser que tentar encontrar conteúdo convencional seja como tentar encontrar uma agulha no palheiro. A enorme desordem do conteúdo generativo produzido por IA será semelhante a fardos de feno superdimensionados e estendidos. Em algum lugar, haverá aquelas pequenas joias preciosas de conteúdo convencional, se você puder encontrá-las.

Você pode estar pensando imediatamente que os fabricantes de índices devem descobrir como lidar com esse dilema. Se eles puderem fazer a indexação da “maneira certa”, então praticamente não importa quanto conteúdo generativo de IA é produzido. Ele ficará nas ruas secundárias e becos da Internet e não verá a luz do dia de qualquer maneira.

Vamos continuar nossa exploração para ver como esse problema de indexação surge.

Avaliando o que é conteúdo generativo produzido por IA

Ok, se a IA generativa vai enlouquecer e produzir toneladas e toneladas de conteúdo da Internet, logicamente podemos lidar com isso, desde que possamos distinguir esse conteúdo do conteúdo “convencional”.

Parece fácil como solução.

Qualquer mecanismo de pesquisa que faça indexação apenas detectaria se o conteúdo é produzido por IA generativa versus produzido convencionalmente. O índice pode optar por não incluir os materiais de IA generativa ou marcar no índice que o conteúdo é de IA generativa. Os usuários desse mecanismo de pesquisa podem especificar durante uma pesquisa se desejam abranger o conteúdo de IA generativo ou ignorá-lo.

Caso encerrado.

Lamento dizer que isso não é especialmente viável.

Aqui está o porquê.

Tentar distinguir as saídas generativas de IA do conteúdo convencional não é fácil e, em última análise, será impraticável. Cobri em minha coluna que esses supostos aplicativos de detecção são uma falsa promessa e essencialmente uma charada enganosa, consulte o link aqui.

Em resumo, os fabricantes de IA de IA generativa continuam aprimorando sua IA para produzir conteúdo que é, por design, indistinguível do conteúdo convencional gerado por humanos. Esse é um objetivo intencional. Os aplicativos de detecção enfrentam uma estratégia contínua de gato e rato. Além disso, esses aplicativos de detecção são baseados em todos os tipos de suposições sobre o que distingue as saídas generativas de IA, embora essas suposições sejam frequentemente incorretas ou baseadas apenas em probabilidades. O resultado final é que qualquer aplicativo de detecção está apenas adivinhando a probabilidade e não é capaz de fazer uma indicação segura.

O ponto principal é que é improvável que sejamos capazes de determinar o que é conteúdo de IA generativo, a menos que haja alguma indicação clara fornecida pelo provedor de IA generativa, embora isso também não seja rígido. Mais uma vez, veja minha cobertura deste tópico complexo, discutido em o link aqui. A ideia perseguida é que uma marca d'água seja secretamente incluída no conteúdo gerado. Você poderia, em teoria, usar a marca d'água para descobrir se o conteúdo foi via IA generativa. A desvantagem é que, com várias alterações na saída, será relativamente fácil estragar a marca d'água. O conteúdo não obedecerá à marca d'água e a placa de sinalização que deveria nos derrubar agora está derrotada.

Alguns acreditam que precisamos de novas leis de IA para lidar com isso. Faça leis que exijam que aplicativos de IA generativos incluam marcas d'água. Além disso, torne ilegal tentar anular essas marcas d'água. Este pode ser o único meio de reduzir esses jogos tecnológicos de gato e rato. Examinei essas propostas em minha coluna e apontei que, embora os preceitos pareçam razoáveis, o diabo está nos detalhes da implementação desses esquemas e do cumprimento dessas políticas.

Em suma, voltando às preocupações sobre o inchaço da Internet por meio de conteúdo generativo de IA, infelizmente não conseguiremos resolver o problema simplesmente observando o que é conteúdo generativo de IA e o que não é. O problema é mais difícil do que isso.

O que há de errado com o conteúdo de IA generativa de qualquer maneira

Toda essa preocupação com o tsunami de conteúdo generativo produzido por IA geralmente se baseia em uma suposição bastante essencial, a saber, que o conteúdo será defeituoso.

Se o conteúdo for bom, presumivelmente devemos ficar satisfeitos com as postagens adicionadas à Internet. Claro, o volume pode ser alto, mas se a informação postada valer a pena, então é simplesmente uma questão de ter mais coisas boas para filtrar. Quanto mais, melhor, como dizem.

A principal consideração envolve se o conteúdo generativo produzido por IA será ou não informativo ou talvez cheio de erros, falsidades, desinformação, desinformação e coisas do gênero. Isso traz várias facetas.

Primeiro, pode ser que a IA generativa seja ainda mais avançada, de modo que as chances de produzir ensaios com resultados ruins sejam extremamente baixas. Aparentemente, seríamos negligentes se quiséssemos de alguma forma proibir toda a IA generativa de ser postada na Internet, assumindo que, em geral, os ensaios gerados por IA generativa são razoavelmente corretos na maioria ou na preponderância do tempo. Desejar rejeitar todos os ensaios produzidos seria semelhante ao clássico jogar fora o bebê com a água do banho (um velho ditado, provavelmente próximo da aposentadoria).

Em segundo lugar, como discuti em minha coluna no o link aqui, há um interesse crescente em aplicativos complementares de IA que podem fazer a verificação dupla de ensaios generativos gerados por IA. Os verificadores duplos de IA podem ser usados ​​antes que as pessoas publiquem conteúdo generativo de IA na Internet. Mesmo que as pessoas não pré-selecionem o conteúdo que desejam postar, as mesmas ferramentas podem ser usadas em conteúdo já postado. Em suma, a verificação dupla pode ser feita independentemente da fonte do conteúdo, de modo que devemos naturalmente suspeitar também do conteúdo gerado por humanos.

Em terceiro lugar, como aludido no meu ponto mencionado acima, a crença muitas vezes parece ser que o conteúdo gerado por humanos é sempre bom, enquanto o conteúdo generativo de IA é sempre ruim. Uma falsa suposição maluca. Há muito conteúdo gerado por humanos que contém todos os tipos de erros, falsidades e lixo inventado. Não estamos seguros apenas porque um humano criou conteúdo manualmente.

Todo o conteúdo, seja desenvolvido por humanos ou por IA generativa, precisa ser submetido a escrutínio.

As pessoas postarão o conteúdo de IA generativa na Internet

Outro fator a considerar é se as pessoas realmente vão postar conteúdo generativo de IA na Internet e, em caso afirmativo, em que magnitude.

Aqui está o que quero dizer.

As pessoas estão usando IA generativa, como o ChatGPT, para uma ampla variedade de propósitos. Eles podem usar IA generativa para estimular ideias sobre um problema que estão enfrentando. Eles podem usá-lo para fazer pesquisas. Eles podem usá-lo para fornecer um rascunho do material que pretendem editar e, em seguida, enviá-lo a alguém por e-mail. E assim por diante.

O ponto crucial é que muito do uso de IA generativa pode não ter nada a ver com alguém com o objetivo de postar os ensaios resultantes na Internet. Parece que muitas vezes caímos na armadilha de que, só porque alguém usa IA generativa, deseja inundar a Internet com os resultados produzidos.

Ainda não sabemos quanto tempo as pessoas usarão IA generativa para seus próprios usos e, portanto, optarão por não postar as saídas para a Internet.

Para esclarecer, não estou sugerindo que as pessoas não postarão saídas generativas de IA na Internet. Eles certamente irão. As pessoas que estão fazendo blogs online, sem dúvida, farão uso de IA generativa. Muitos usos de IA generativa para produzir conteúdo para a Internet certamente ocorrerão. etc.

Assim, uma consideração é que talvez não tenhamos tanto conteúdo de IA generativo postado na Internet quanto se poderia supor que ocorreria. Para aqueles especialistas que supõem que estamos diante de um apocalipse de dados sem parar e desenfreado, não sabemos se é isso que vai acontecer. Claro, mesmo que apenas um mínimo de pessoas opte por fazer tais postagens, isso ainda pode ser uma quantidade enorme de conteúdo adicionado sendo empilhado na Internet.

Uma reviravolta é se as saídas de IA generativas serão postadas automaticamente na Internet.

Este é um truque fácil de fazer. Você pode simplesmente fazer com que qualquer resultado do seu aplicativo de IA generativo seja imediatamente postado na Internet. Você pode até colocar isso em um loop. Tenha uma série de prompts pré-enlatados. Alimente-os em um aplicativo de IA generativo. O aplicativo AI generativo é programado para postar imediatamente os ensaios produzidos na Internet.

Voila, você tem uma máquina de movimento perpétuo para gerar conteúdo de dados para a Internet.

Mas para onde vão as postagens?

Quaisquer sites ou outros locais on-line que permitem a postagem desse tipo de conteúdo de metralhadora serão potencialmente responsabilizados pelo que estão permitindo que surja. Presumivelmente, as pessoas evitarão esses sites. Ou esses sites serão marcados por mecanismos de busca e algoritmos de indexação. O aspecto em que o conteúdo generativo de IA é postado é um aspecto, enquanto outro aspecto igualmente crucial é onde as postagens serão feitas.

Talvez as abordagens de paywall sejam reverenciadas

Uma afirmação comumente expressa é que acabaremos nos cansando do Velho Oeste da Internet. As pessoas vão gravitar em torno de fontes online confiáveis. Eles evitarão propositalmente outras áreas incompletas ou desconhecidas da Internet.

Nesse sentido, pensa-se que as pessoas estarão dispostas a pagar para acessar fontes confiáveis. Considerando que hoje ainda há um grande debate sobre a lucratividade do conteúdo paywall, a enxurrada de conteúdo generativo de IA é considerada uma benção para a filosofia do paywall. Quanto pior as coisas em termos de encontrar conteúdo confiável na Internet, mais valioso o conteúdo com acesso pago se torna (supondo, é claro, que o conteúdo com acesso pago seja examinado com mais atenção).

A ironia é que o conteúdo por trás do acesso pago pode consistir fortemente em conteúdo generativo produzido por IA. Supondo que o valor agregado seja que o provedor de acesso pago está rastreando o conteúdo, eles estão essencialmente fazendo a verificação dupla que mencionei anteriormente. Eles não precisam necessariamente gerar o conteúdo. Eles só precisam garantir que o conteúdo seja digno de confiança.

Há divergências sobre esse futuro previsto. Talvez, em vez de paywalls, você precise encontrar anúncios ou notificações de patrocinadores e, assim, chegar ao conteúdo confiável. Existem muitas outras possibilidades.

O pântano multimodal da IA ​​generativa aguarda

Tenho me concentrado aqui na IA generativa relacionada a texto. Essa é a variedade de texto para texto ou texto para ensaio de IA generativa, como o ChatGPT.

Uma das minhas previsões é que em breve nos encontraremos inundados por IA generativa multimodal, veja minha explicação em o link aqui. Já estamos testemunhando texto para imagens, texto para áudio, texto para vídeo e outras variantes dos tipos ou modos de resultados gerados pela IA generativa. O próximo passo é que você será capaz de obter saídas multimodais.

Por exemplo, você insere um prompt na IA generativa e pergunta sobre Abraham Lincoln. A IA generativa produz um ensaio para você. Além disso, diversas imagens são geradas de Lincoln, mostrando-o em poses que até então não haviam sido postadas ou publicadas. Uma transcrição de áudio é gerada com o que parece ser uma voz semelhante à de Lincoln. É gerado um vídeo que mostra o ensaio, incluindo uma montagem de fotos e imagens que acompanham o texto finalizado.

Bem-vindo ao mundo da IA ​​generativa multimodal.

Emocionante, com certeza.

Mas talvez não seja tão empolgante se você acredita que isso é mais forragem como conteúdo que pode ser postado na Internet.

Em essência, não vamos nos preocupar apenas com o texto que pode estar errado, também precisaremos fazer o mesmo para todos os outros modos de saída. Os arquivos de áudio devem ser suspeitos de conter falsidades, as imagens podem retratar coisas falsas e os vídeos também serão preocupantes.

Se você ainda não incluiu em seus cálculos sobre o inchaço da Internet a conflagração multimodal, talvez queira aumentar seus números e sua escrita manual.

Ciclos viciosos ou virtuosos de IA generativa

Eu tenho um fator para você que pode causar um pouco de confusão mental. Espere.

Nesta saga da Internet inundada, assumimos que a IA generativa é a vilã. IA generativa é como todo esse conteúdo inventado e propenso a erros será produzido. A IA generativa é ruim até os ossos.

Suponha, porém, que olhemos para isso sob uma luz diferente.

Pode ser que a IA generativa seja capaz de produzir o conteúdo válido mais estridente e forte. Enquanto isso, o conteúdo gerado pela mão humana é interpretado como muito menos confiável. A IA generativa como um vilão muda para a IA generativa como o herói.

Pense sobre isso.

Eu tenho outra reviravolta divertida para você.

Vamos supor que a IA generativa esteja sendo treinada por dados por meio de conteúdo que está na Internet. Se assumirmos também que o conteúdo generativo de IA será postado na Internet, seja por escolha humana diretamente ou por meio de um mecanismo automático, nos encontraremos enredados em um ciclo intrigante.

O conteúdo produzido pela IA generativa se torna o material de origem para treinamento adicional de dados em IA generativa. Uma espiral ocorre. Cada vez mais conteúdo generativo produzido por IA é postado na Internet, com base no treinamento de dados de conteúdo já produzido por IA generativa.

O que essa câmara de eco de “IA generativa alimentando-se de IA generativa” acaba fazendo com a Internet e a humanidade?

Um ponto de vista é que esta é uma corrida horrível para o fundo. Os erros nas saídas generativas de IA serão ampliados. Cada nova iteração de IA generativa consumirá os erros anteriores e os repetirá continuamente. Em algum momento, as chances de descobrir onde estão os erros serão assustadoras. Triste. Desanimador.

Outro ponto de vista é que, se a IA generativa puder ser projetada para produzir saídas válidas, você poderá ter um mecanismo de limpeza da Internet que ajude a enfeitar a Internet. Quando a IA generativa encontra algo errado, seja produzido pela IA ou pela mão humana, a IA generativa aparentemente detecta e supera essa falsidade. Com a IA generativa fazendo isso repetidamente, é como se você estivesse constantemente cortando a grama e reduzindo efetivamente a natureza e o destaque das ervas daninhas.

Isso pode soar reconfortante, exceto pela grande e iminente questão do que exatamente constitui erros ou falsidades. Esta máquina de depuração pode inadvertidamente fazer com que um conteúdo válido seja menosprezado ou falsamente acusado de ser propenso a erros. Precisamos estar atentos a esses falsos positivos e falsos negativos ao considerar esses tipos de mecanismos.

A IA generativa será um ciclo vicioso ou um ciclo virtuoso?

O tempo dirá.

Conclusão

As numerosas e às vezes apavoradas exortações sobre a IA generativa inundando a Internet devem ser cuidadosamente examinadas. Muitos cenários podem ser facilmente imaginados. Doom e melancolia não é a única avenida. Qualquer um que pretenda prever o que vai acontecer deve ser franco sobre as suposições que está fazendo.

Existem fatores atenuantes que determinarão para onde o futuro da IA ​​generativa irá. A Ética da IA ​​e a Lei da IA ​​terão uma participação decisiva nisso, juntamente com as percepções gerais da sociedade em geral.

Uma observação final por enquanto.

Marco Aurélio declarou a famosa frase: “Nunca deixe o futuro perturbá-lo. Você o enfrentará, se for preciso, com as mesmas armas da razão que hoje o armam contra o presente.”

Vamos garantir que nosso raciocínio de hoje possa enfrentar os desafios de um futuro carregado de IA.

Fonte: https://www.forbes.com/sites/lanceeliot/2023/02/23/is-it-true-that-generative-ai-chatgpt-will-flood-the-internet-with-infinite-content- pergunta-ai-ética-e-ai-lei/