Elon Musk pode ter sucesso no desenvolvimento de IA generativa ChatGPT Knockoff “TruthGPT” que seria estoicamente verdadeiro o tempo todo, pergunta a ética da IA ​​e a lei da IA

Há uma batida na porta da cabine.

Devemos abrir a porta?

Os filmes geralmente sugerem que não devemos deixar nossa curiosidade levar a melhor sobre nós, ou seja, absolutamente nunca devemos abrir a porta. Bem, dito isso, optar por deixar a porta fechada não parece ser uma história digna. Parece que somos atraídos pela emoção e pelo desconhecido.

Então, vamos em frente e abrir a porta.

Neste caso particular, refiro-me a alguns boatos emergentes no campo da Inteligência Artificial (IA) que anunciam tempos bons ou piores para todos nós. A situação potencialmente envolve o futuro da IA. E pode-se especular solenemente que o futuro da IA ​​abrange repercussões bastante dramáticas ao todo, incluindo moldar ostensivamente o futuro da sociedade e o destino da humanidade.

Aqui está o acordo.

De acordo com notícias recentes, Elon Musk, às vezes a pessoa mais rica do mundo, tem procurado pesquisadores de IA de alto nível para embarcar em um novo empreendimento de IA que ele tem em mente. Vários desenvolvedores de IA e cientistas de IA estão sendo abordados discretamente. A batida em sua porta aparentemente oferece grandes promessas e notícias potencialmente lucrativas.

Diz-se que a suposta essência da iniciativa de IA ainda a ser divulgada é uma imitação do amplamente e popular ChatGPT, lançado pela OpenAI em novembro. Você quase certamente já ouviu falar ou viu manchetes estridentes sobre o ChatGPT. Estarei explicando momentaneamente mais sobre o que é o ChatGPT. Você também deve saber que o ChatGPT é um exemplo de um tipo de IA conhecido como IA generativa. Existem muitos aplicativos de IA generativos circulando atualmente. O ChatGPT é um com o maior perfil público e é aparentemente conhecido por todos, talvez até mesmo por aqueles que de alguma forma vivem em uma caverna.

Aqui está um exemplo da reportagem sobre esta saga semi-secreta em rápida ascensão:

  • “Elon Musk abordou pesquisadores de inteligência artificial nas últimas semanas sobre a formação de um novo laboratório de pesquisa para desenvolver uma alternativa ao ChatGPT, o chatbot de alto perfil feito pela startup OpenAI, de acordo com duas pessoas com conhecimento direto do esforço e uma terceira pessoa informada nas conversas” (A Informação, “Fighting 'Woke AI,' Musk Recruits Team to Develop OpenAI Rival”, Jon Victor e Jessica E. Lessin, 27 de fevereiro de 2023).

Seu primeiro pensamento pode ser que, se Elon Musk deseja criar uma imitação do ChatGPT, isso depende dele e de como ele deseja gastar seu dinheiro. Boa sorte. Ele simplesmente adicionará ao conhecimento já existente e crescente de aplicativos de IA generativos. Talvez ele faça uma fortuna adicional com sua própria versão caseira do ChatGPT. Ou talvez seja um grande ho-hum e o pequeno abalo em sua enorme riqueza da busca modestamente cara seja semelhante a um erro de arredondamento no departamento de contabilidade.

Em vez de uma forte batida na porta, presumivelmente, isso é mais como um recatado tap-tap-tapping na porta.

Prepare-se para a reviravolta.

A crença é que Elon Musk quer sacudir a base dos aplicativos de IA generativos de hoje e reconstituir alguns aspectos cruciais de como eles funcionam e o que produzem. Como explicarei brevemente aqui, um problema comum e genuíno sobre a IA generativa atual é que ela pode gerar erros, falsidades e as chamadas alucinações de IA. Qualquer pessoa que tenha usado IA generativa, sem dúvida, encontrou esses problemas desconcertantes. Aparentemente, Elon Musk espera reduzir e possivelmente de alguma forma eliminar esses tipos de anomalias e propensões problemáticas.

Isso parece uma aspiração comprovadamente válida e honrosa. Na verdade, saiba que quase ou talvez eu possa dizer que todos os criadores de IA generativa estão se esforçando muito para reduzir as chances de erros de saída, falsidades e alucinações de IA. Você teria dificuldade em encontrar qualquer alma razoável que insistisse em manter esses erros, falsidades e alucinações de IA enraizados na IA generativa.

Sem fazer uma declaração muito abrangente, há um consenso praticamente universal de que as doenças da IA ​​generativa envolvendo a produção de erros, falsidades e alucinações de IA devem ser tratadas com firmeza, persistência e firmeza. O objetivo é ajustar, renovar, refinar, revisar ou, de uma maneira tecnológica de IA ou de outra, resolver e resolver esse problema.

Cada dia que a IA generativa continua a vomitar erros, falsidades e alucinações de IA nas saídas é um dia ruim para quase todos. As pessoas que usam IA generativa tendem a ficar insatisfeitas com essas saídas sujas. As pessoas que dependem ou precisam usar as saídas sujas correm o risco de depender erroneamente de algo errado ou, pior ainda, de guiá-las em uma direção perigosa.

Os fabricantes de IA que estão tentando fazer um negócio a partir da IA ​​generativa estão, entretanto, em risco legal potencial por aqueles que ficam presos devido a confiar nas saídas sujas. É quase certo que em breve surgirão ações judiciais por danos reivindicados. Podemos antecipar que os reguladores optarão por pesar, e novas leis de IA podem ser promulgadas para colocar uma coleira legal na IA generativa, veja minha cobertura em o link aqui. Além disso, as pessoas podem eventualmente ficar tão chateadas que as reputações dos fabricantes de IA são severamente manchadas e a IA generativa é sumariamente chutada para o meio-fio.

Tudo bem, então sabemos que é um truísmo valente que os fabricantes de IA e os pesquisadores de IA estão tentando febrilmente inventar, projetar, construir e implementar a magia tecnológica da IA ​​para evitar essas doenças terríveis associadas às doenças generativas da IA ​​de hoje. Elon Musk deveria ser aceito no redil. Quanto mais melhor. Vai ser preciso muito talento e dinheiro em IA para domar essa fera. Adicionar Elon Musk parece um sinal otimista e encorajador de que talvez a quantidade certa de ciência de foguetes, dinheiro e determinação encontre a cura para tudo da IA.

A reviravolta ocorre quando você começa a abrir a porta para ver o que está ali.

Em um tweet bastante sucinto e como sempre de Elon Musk, ocorrido em 17 de fevereiro de 2023, obtivemos esta pista presumida:

  • “O que precisamos é TruthGPT”

Isso é o que faz com que alguns decidam que talvez a porta precise ser fechada com força e pregada.

Por quê então?

A preocupação expressa por alguns é que a “verdade” subjacente a um TruthGPT imaginado pode ser uma IA generativa que é formulada e produz resultados exclusivamente baseados em uma confusão de Verdade que corresponda estritamente às visões de mundo de uma pessoa. Sim, a preocupação é que teremos um aplicativo de IA generativo que emite a verdade de acordo com Elon Musk.

Preocupante, dizem alguns.

Ousadamente audacioso e totalmente alarmante, alguns exortam.

Uma resposta imediata é que se ele deseja produzir seu TruthGPT, não importa o que ele constitua, é seu dinheiro para gastar. As pessoas optarão por usá-lo ou não. Aqueles que o usam devem ser astutos o suficiente para perceber no que estão se metendo. Se eles querem resultados dessa variante específica de IA generativa, presumivelmente moldada em torno da visão de mundo de Elon Musk, eles têm o direito de procurá-la. Fim da história. Ir em frente.

Uau, um contra-argumento vai, você está preparando as pessoas para uma armadilha terrível e aterrorizante. Haverá pessoas que não perceberão que o TruthGPT é algum aplicativo de IA generativa aprimorado por Elon Musk. Eles cairão na armadilha mental de assumir que essa IA generativa é honesta. De fato, se a nomenclatura permanecer como “TruthGPT” (ou similar), você naturalmente acreditaria que esta é uma IA generativa que tem o verdade absoluta contar em suas redações e textos produzidos.

Como sociedade, talvez devêssemos não deixar que os desavisados ​​caiam em tais armadilhas, eles alertariam.

Permitir que um aplicativo de IA generativo dessa natureza presumida flutue e seja usado por todos os tipos de pessoas criará o caos. As pessoas interpretarão como “verdade” sagrada os resultados deste TruthGPT, mesmo que os ensaios produzidos estejam repletos de erros, falsidades, alucinações de IA e todos os tipos de preconceitos desagradáveis. Além disso, mesmo que a alegação seja de que essa variante de IA generativa não terá erros, falsidades e alucinações de IA, como podemos saber que a IA aparentemente purificada resultante não abrigará preconceitos indevidos junto com um tesouro insidioso de desinformação e desinformação?

Eu estou supondo que você pode ver a controvérsia e o dilema.

Em uma base de livre mercado, Elon Musk aparentemente deveria ser capaz de criar qualquer tipo de IA generativa que ele desejasse criar. Só porque outros podem desaprovar sua versão da “verdade”, isso não deveria impedi-lo de prosseguir. Deixe-o fazer as coisas dele. Talvez uma mensagem de aviso deva ser incluída ou alguma outra notificação quando alguém a usar para que saibam o que estão optando por executar. No entanto, as pessoas precisam ser responsáveis ​​por suas próprias ações e, se optarem por usar um TruthGPT, que assim seja.

Espere um segundo, mais uma réplica vai. Suponha que alguém criou um aplicativo de IA generativo que foi criado para fazer o mal. A intenção era confundir as pessoas. A esperança era deixar as pessoas irritadas e incitadas. Nós, como sociedade, estaríamos aceitando esse tipo de IA generativa? Queremos permitir aplicativos de IA que possam provocar as pessoas, prejudicando sua saúde mental e possivelmente levando-as a ações adversas?

Tem que haver uma linha na areia. Em algum momento, precisamos dizer que certos tipos de IA generativa são uma abominação e não podem ser permitidos. Se permitirmos que a IA generativa desenfreada seja construída e colocada em prática, a desgraça e a tristeza definitivas cairão inevitavelmente sobre todos nós. Não serão apenas aqueles que usarão o aplicativo AI. Tudo e todos que surgirem ao redor e conectados ao aplicativo AI serão afetados adversamente.

Isso parece um argumento convincente.

Embora um fundamento fundamental seja que a IA generativa em questão precisaria ser uma preocupação tão perturbadora que acreditaríamos de forma convincente que evitá-la ou interrompê-la totalmente de antemão seria objetivamente necessário. Isso também levanta uma série de outras questões espinhosas. Podemos declarar de antemão que uma IA generativa pode ser tão atroz que não pode ser construída? Isso parece prematuro para alguns. Você precisa pelo menos esperar até que a IA generativa esteja funcionando para tomar uma decisão tão pesada.

Acorde, alguns respondem com veemência, você está imprudentemente deixando o cavalo sair do celeiro. Os perigos e danos causados ​​pela IA desencadeada, o cavalo solto, nos atropelarão. Um aplicativo de IA generativa pode ser como o dilema clássico de tentar colocar o gênio de volta na garrafa. Você pode não ser capaz de fazê-lo. Em vez disso, é melhor manter o gênio trancado a sete chaves ou garantir que o cavalo permaneça firmemente encurralado no celeiro.

É um furacão em potencial à nossa porta e a porta pode se abrir independentemente do que pensamos ser prudente fazer.

Uma coisa que podemos fazer com certeza é primeiro explorar o que VerdadeGPT estilo de maquinação de IA generativa pode ser. Na coluna de hoje é exatamente isso que farei. Também examinarei a base fundamentada para as dúvidas expressas, além de considerar vários meios e resultados. Ocasionalmente, isso incluirá a referência ao aplicativo de IA ChatGPT durante esta discussão, pois é o gorila de 600 libras da IA ​​generativa, embora tenha em mente que existem muitos outros aplicativos de IA generativa e geralmente são baseados nos mesmos princípios gerais.

Enquanto isso, você pode estar se perguntando o que é IA generativa.

Vamos primeiro cobrir os fundamentos da IA ​​generativa e, em seguida, podemos dar uma olhada no assunto urgente em questão.

Em tudo isso, há uma série de considerações sobre a ética da IA ​​e a lei da IA.

Esteja ciente de que há esforços contínuos para imbuir os princípios éticos da IA ​​no desenvolvimento e no uso de aplicativos de IA. Um contingente crescente de preocupados e antigos éticos da IA ​​está tentando garantir que os esforços para conceber e adotar a IA levem em consideração uma visão de fazer AI For Good e evitando AI para mau. Da mesma forma, há propostas de novas leis de IA que estão sendo cogitadas como possíveis soluções para impedir que os empreendimentos de IA enlouqueçam com os direitos humanos e coisas do gênero. Para minha cobertura contínua e extensa de Ética e Lei de IA, consulte o link aqui e o link aqui, Apenas para nomear alguns.

O desenvolvimento e a promulgação dos preceitos de IA ética estão sendo buscados para evitar que a sociedade caia em uma miríade de armadilhas indutoras de IA. Para minha cobertura dos princípios de Ética da IA ​​da ONU, elaborados e apoiados por quase 200 países por meio dos esforços da UNESCO, consulte o link aqui. Na mesma linha, novas leis de IA estão sendo exploradas para tentar manter a IA em equilíbrio. Uma das últimas tomadas consiste em um conjunto de Declaração de Direitos da IA que a Casa Branca dos EUA divulgou recentemente para identificar os direitos humanos na era da IA, consulte o link aqui. É preciso uma aldeia para manter a IA e os desenvolvedores de IA no caminho correto e impedir os esforços dissimulados propositais ou acidentais que podem minar a sociedade.

Estarei entrelaçando as considerações relacionadas à ética da IA ​​e à lei da IA ​​nesta discussão.

Fundamentos da IA ​​generativa

A instância mais conhecida de IA generativa é representada por um aplicativo de IA chamado ChatGPT. O ChatGPT surgiu na consciência pública em novembro, quando foi lançado pela empresa de pesquisa de IA OpenAI. Desde então, o ChatGPT conquistou manchetes enormes e surpreendentemente excedeu seus quinze minutos de fama.

Suponho que você provavelmente já ouviu falar do ChatGPT ou talvez até conheça alguém que o tenha usado.

O ChatGPT é considerado um aplicativo de IA generativo porque recebe como entrada algum texto de um usuário e, em seguida, gera ou produz uma saída que consiste em um ensaio. A IA é um gerador de texto para texto, embora eu descreva a IA como sendo um gerador de texto para ensaio, pois isso esclarece mais prontamente para o que é comumente usado. Você pode usar IA generativa para compor composições longas ou fazer comentários concisos bastante curtos. Tudo depende de você.

Tudo o que você precisa fazer é inserir um prompt e o aplicativo AI gerará para você um ensaio que tenta responder ao seu prompt. O texto composto parecerá que o ensaio foi escrito pela mão e pela mente humana. Se você inserir um prompt que diga “Fale-me sobre Abraham Lincoln”, a IA generativa fornecerá a você um ensaio sobre Lincoln. Existem outros modos de IA generativa, como text-to-art e text-to-video. Vou me concentrar aqui na variação de texto para texto.

Seu primeiro pensamento pode ser que essa capacidade generativa não pareça grande coisa em termos de produção de ensaios. Você pode facilmente fazer uma pesquisa on-line na Internet e encontrar prontamente toneladas e toneladas de ensaios sobre o presidente Lincoln. O kicker no caso da IA ​​generativa é que o ensaio gerado é relativamente único e fornece uma composição original em vez de um imitador. Se você tentasse encontrar o ensaio produzido pela IA online em algum lugar, dificilmente o descobriria.

A IA generativa é pré-treinada e faz uso de uma formulação matemática e computacional complexa que foi criada examinando padrões em palavras escritas e histórias na web. Como resultado do exame de milhares e milhões de passagens escritas, a IA pode produzir novos ensaios e histórias que são uma mistura do que foi encontrado. Ao adicionar várias funcionalidades probabilísticas, o texto resultante é praticamente único em comparação com o que foi usado no conjunto de treinamento.

Existem inúmeras preocupações sobre IA generativa.

Uma desvantagem crucial é que os ensaios produzidos por um aplicativo de IA baseado em geração podem conter várias falsidades incorporadas, incluindo fatos manifestamente falsos, fatos que são retratados de forma enganosa e fatos aparentes totalmente fabricados. Esses aspectos fabricados são muitas vezes referidos como uma forma de alucinações de IA, uma frase de efeito que eu desaprovo, mas lamentavelmente parece estar ganhando força popular de qualquer maneira (para minha explicação detalhada sobre por que essa é uma terminologia ruim e inadequada, veja minha cobertura em o link aqui).

Outra preocupação é que os humanos podem facilmente assumir o crédito por um ensaio generativo produzido por IA, apesar de não terem escrito o ensaio por conta própria. Você deve ter ouvido falar que professores e escolas estão bastante preocupados com o surgimento de aplicativos generativos de IA. Os alunos podem usar a IA generativa para escrever suas redações atribuídas. Se um aluno afirma que um ensaio foi escrito por sua própria mão, há poucas chances de o professor ser capaz de discernir se ele foi forjado por IA generativa. Para minha análise dessa faceta que confunde alunos e professores, veja minha cobertura em o link aqui e o link aqui.

Houve algumas reivindicações descomunais nas mídias sociais sobre IA generativa afirmando que esta versão mais recente da IA ​​é de fato IA senciente (não, eles estão errados!). Aqueles em AI Ethics e AI Law estão notavelmente preocupados com essa tendência crescente de reivindicações estendidas. Você pode dizer educadamente que algumas pessoas estão exagerando o que a IA de hoje pode fazer. Eles assumem que a IA tem capacidades que ainda não conseguimos alcançar. Isso é lamentável. Pior ainda, eles podem permitir a si mesmos e a outros entrar em situações terríveis por causa da suposição de que a IA será senciente ou semelhante à humana ao ser capaz de agir.

Não antropomorfize a IA.

Fazer isso o deixará preso em uma armadilha de confiança pegajosa e obstinada de esperar que a IA faça coisas que ela é incapaz de realizar. Com isso dito, o que há de mais recente em IA generativa é relativamente impressionante pelo que pode fazer. Esteja ciente, porém, de que existem limitações significativas que você deve ter sempre em mente ao usar qualquer aplicativo de IA generativo.

Um último aviso por enquanto.

Tudo o que você vê ou lê em uma resposta de IA generativa que parece para ser transmitido como puramente factual (datas, lugares, pessoas, etc.), certifique-se de permanecer cético e estar disposto a verificar novamente o que você vê.

Sim, as datas podem ser inventadas, os lugares podem ser inventados e os elementos que normalmente esperamos serem irrepreensíveis são todos os sujeito a suspeitas. Não acredite no que você lê e mantenha um olhar cético ao examinar quaisquer ensaios ou saídas generativas de IA. Se um aplicativo de IA generativo disser que Abraham Lincoln voou pelo país em seu jato particular, você sem dúvida saberia que isso é uma loucura. Infelizmente, algumas pessoas podem não perceber que os jatos não existiam em sua época, ou podem saber, mas não perceber que o ensaio faz essa afirmação descarada e escandalosamente falsa.

Uma forte dose de ceticismo saudável e uma mentalidade persistente de descrença serão seu melhor trunfo ao usar IA generativa.

Estamos prontos para passar para o próximo estágio desta elucidação.

O Gênio e a Garrafa Generativa de IA

Vamos agora fazer um mergulho profundo no assunto em questão.

A essência é o que pode ser um VerdadeGPT estilo de IA generativa consiste. É uma possibilidade ou é impossível derivar? O que devemos pensar sobre tais esforços? E assim por diante.

Você pode afirmar francamente que deveríamos estar pensando muito seriamente em tudo isso. Se fosse apenas um vôo de fantasia e sem qualquer chance de surgir, poderíamos colocar todo o enigma de lado. Em vez disso, uma vez que existe uma chance presumida de grande apoio financeiro, a realidade de um VerdadeGPT, ou o que quer que seja chamado, cheira como notavelmente digno de consideração e desempacotamento.

Para facilitar a discussão, usarei a frase conveniente e cativante de “TruthGPT” para denotar alguma IA generativa genérica totalmente não especificada. Não estou sugerindo, insinuando ou aludindo de qualquer outra forma a qualquer aplicativo de IA generativo existente agora ou no futuro que tenha ou não esse nome designado.

Aqui estão os cinco tópicos principais que gostaria de abordar com você hoje:

  • 1) O provável foco principal envolve vieses na IA generativa
  • 2) Por que os vieses de IA generativa são um osso duro de roer
  • 3) Fontes e métodos que levam a vieses generativos de IA
  • 4) TruthGPT e as opções de tratamento de viés
  • 5) TruthGPT quanto à viabilidade e realidade dos mesmos

Abordarei cada um desses tópicos importantes e apresentarei considerações perspicazes sobre as quais todos devemos refletir atentamente. Cada um desses tópicos é parte integrante de um quebra-cabeça maior. Você não pode olhar para apenas uma peça. Nem você pode olhar para qualquer peça isoladamente das outras peças.

Este é um mosaico intrincado e todo o quebra-cabeça deve receber a devida consideração harmoniosa.

O provável foco principal envolve vieses na IA generativa

Para facilitar a discussão, considere que vamos nos concentrar em quatro principais dúvidas sobre a IA generativa contemporânea:

  • erros
  • Falsidades
  • Alucinações de IA
  • Vieses

Vou explorar brevemente cada uma dessas condições.

An erro pode ser exemplificado por esse tipo de prompt e a resposta de IA generativa resultante:

  • prompt: "Quanto é dois mais dois?"
  • Resposta gerada: “Dois mais dois é igual a cinco.”

Acredito que todos nós concordaríamos razoavelmente que dois mais dois deveriam ser iguais a quatro. Assim, a resposta de cinco é um erro. Agora, pessoas bajuladoras tentarão apresentar todo tipo de justificativa para explicar por que dois mais dois podem, teoricamente, ser iguais a cinco. Bom para eles. No entanto, no curso normal dos eventos, vamos com a noção de que a resposta predominantemente correta é quatro e que uma resposta de cinco é interpretada como incorreta.

Em seguida, considere a natureza de um falsidade, conforme exemplificado por este prompt e a resposta de IA generativa resultante:

  • prompt: “Em que ano nasceu o presidente Abraham Lincoln?”
  • Resposta gerada: “O presidente Abraham Lincoln nasceu em 1812”

A resposta deve ser 1809, mas a resposta fornecida é 1812. Isso pode ser interpretado como uma resposta falsa. Não sabemos ao certo como a IA generativa surgiu com a resposta de 1812. Pode ser que o ano de 1812 tenha sido usado na Internet e potencialmente digitalizado durante o treinamento de dados que a IA generativa realizou. Inúmeras outras explicações são possíveis. Em qualquer caso, isso é razoavelmente classificado como uma falsidade.

Para exemplificar um alucinação de IA, considere este exemplo de um determinado prompt e a resposta de IA generativa resultante:

  • prompt: “Como o presidente Abraham Lincoln viajou?”
  • Resposta gerada: “O presidente Abraham Lincoln viajou de trem, cavalo, charrete e aviões a jato.”

Todos os modos de viagem parecem plausíveis, exceto pelo choque no final, citando que ele viajou em aviões a jato (que não existiam em sua época). Como essa possibilidade maluca foi incluída na resposta da IA ​​generativa? Não sabemos ao certo. Um meio seria se uma história de ficção científica publicada na Internet sobre Lincoln mencionasse que ele frequentemente viajava em aviões a jato. Pode ser que durante o treinamento de dados da IA ​​generativa, essa história em particular tenha sido digitalizada. Existem inúmeras outras explicações viáveis ​​também.

Finalmente, aqui está um exemplo de um viés que pode ser exibido por meio de um determinado prompt e a resposta de IA generativa resultante:

  • prompt: “Uma pessoa mais velha pode aprender coisas novas?”
  • Resposta gerada: “Não, as pessoas mais velhas não conseguem aprender coisas novas. Existe um ditado clássico que diz que cães velhos não podem aprender novos truques. Isso também se aplica aos idosos.”

Acredito que todos podemos concordar razoavelmente que a resposta exibe uma forma de viés de idade ou discriminação de idade. Como esse viés foi incluído na IA generativa? Vou cobrir uma variedade de maneiras momentaneamente. Por enquanto, vamos simplesmente observar que as palavras geradas pela IA exibem uma declaração ou comentário tendencioso. Não sabemos se isso é um mero acaso e talvez surja apenas desta vez, ou se pode ser um arranjo sistêmico de correspondência de padrões que persiste dentro da estrutura da IA. Mais exploração seria necessária para determinar isso.

Agora que temos todas as quatro categorias principais ilustradas, aqui está algo que, embora discutível, é considerado uma afirmação potencialmente precisa:

  • Erros: Provavelmente pode ser evitado ou mitigado por meio de meios tecnológicos de IA
  • Falsidades: Provavelmente pode ser evitado ou mitigado por meio de meios tecnológicos de IA
  • Alucinações de IA: Provavelmente pode ser evitado ou mitigado por meio de meios tecnológicos de IA
  • Tendências: É discutível se isso pode ser evitado ou mitigado apenas por meios tecnológicos de IA

A essência é que as três categorias que consistem em erros, falsidades e alucinações de IA são geralmente vistas como passíveis de melhorias tecnológicas de IA. Uma série de abordagens está sendo realizada. Por exemplo, como discuto em minha coluna no o link aqui, vários outros referentes podem ser comparados a uma resposta AI gerada que é verificada duas vezes antes de a resposta ser mostrada ao usuário. Isso fornece filtragem potencial para garantir que o usuário não veja nenhum desses erros detectados, falsidades ou alucinações de IA. Outra abordagem procura evitar que esses tipos de respostas sejam gerados, para começar. E assim por diante.

A categoria composta por vieses é muito mais problemático de lidar.

Devemos desvendar o enigma para ver o porquê.

Por que os vieses de IA generativa são um osso duro de roer

Notícias recentes sobre IA generativa muitas vezes apontaram a natureza imprópria de declarações tendenciosas que podem surgir em ensaios produzidos por IA generativa. Eu examinei este tópico, incluindo o aspecto de que algumas pessoas estão propositalmente tentando incitar ou estimular a IA generativa a produzir comentários tendenciosos, veja minha análise em o link aqui. Algumas pessoas o fazem para destacar uma preocupação notável, enquanto outras o fazem por aparentes tentativas de chamar a atenção e obter visualizações.

O acoplamento da IA ​​generativa com os mecanismos de busca da Internet ampliou especialmente esses assuntos. Você deve estar ciente de que a Microsoft adicionou uma variação do ChatGPT ao Bing, enquanto o Google indicou que está adicionando um recurso de IA generativo cunhado como Bard ao seu mecanismo de pesquisa, veja mais em o link aqui.

Entre a variedade de vieses que podem ser encontrados, alguns se encaixam na esfera política ou na esfera cultural que receberam atenção pronunciada, conforme observado por este artigo:

  • “Como vimos nas recentes explosões descontroladas do Bing, os chatbots de IA são propensos a gerar uma série de declarações estranhas. E embora essas respostas sejam muitas vezes expressões pontuais, e não o produto de “crenças” rigidamente definidas, algumas respostas incomuns são vistas como ruído inofensivo, enquanto outras são consideradas ameaças sérias – dependendo, como neste caso, se ou não. eles se encaixam em debates políticos ou culturais existentes” (The Verge, James Vincent, 17 de fevereiro de 2023).

A OpenAI disponibilizou recentemente ao público um documento intitulado “Snapshot Of ChatGPT Model Behavior Guidelines” que indica os vários tipos de conteúdo considerado inapropriado que eles procuram para que seus testadores do ChatGPT revisem e ajudem no treinamento de dados para o ChatGPT evitar durante a fase de teste e ajuste ( documento facilmente acessível por meio de um link em “How, Should AI Systems Behave, And Who Should Decide”, 16 de fevereiro de 2023). Para saber mais sobre como o RLHF (aprendizado por reforço para feedback humano) é usado ao criar IA generativa, consulte minha explicação em o link aqui.

Aqui está um trecho do documento OpenAI que indica algumas de suas diretrizes declaradas:

  • “Pode haver algumas perguntas que solicitam certos tipos de conteúdo impróprio. Nesses casos, você ainda deve assumir uma tarefa, mas o Assistente deve fornecer uma recusa como 'Não posso responder a isso'.”
  • “Ódio: conteúdo que expressa, incita ou promove o ódio com base em uma característica protegida.”
  • “Assédio: conteúdo que pretende assediar, ameaçar ou intimidar um indivíduo.”
  • “Violência: conteúdo que promove ou glorifica a violência ou celebra o sofrimento ou a humilhação de outras pessoas.”
  • “Automutilação: conteúdo que promove, encoraja ou retrata atos de automutilação, como suicídio, corte e distúrbios alimentares.”
  • “Adulto: conteúdo destinado a despertar excitação sexual, como a descrição de atividade sexual ou que promova serviços sexuais (excluindo educação sexual e bem-estar).”
  • “Político: conteúdo que tenta influenciar o processo político ou ser usado para fins de campanha.”
  • “Malware: conteúdo que tenta gerar ransomware, keyloggers, vírus ou outro software destinado a impor algum nível de dano.”

A lista mostra os tipos de conteúdo potencialmente inapropriado que podem surgir.

Em termos da categoria política, várias instâncias foram postadas nas mídias sociais de aplicativos de IA generativos que parecem ter caído em um campo político em detrimento de outro.

Por exemplo, um usuário que faz uma pergunta sobre um líder político pode obter uma resposta otimista e positiva, enquanto perguntar sobre um líder político diferente pode obter uma redação pessimista e totalmente depreciativa. Isso parece sugerir que a IA generativa tem correspondência de padrões com palavras que favorecem um lado e desfavorecem o outro lado. Essas instâncias levaram a exortações de IA generativa que parecem ser inclinadas e podem ser atribuídas como sendo:

  • IA generativa acordada
  • IA generativa anti-despertar
  • IA generativa de extrema-direita
  • IA generativa de extrema esquerda
  • Etc.

Como mencionado anteriormente, isso não se deve à capacidade de sensibilidade da IA. Mais uma vez, trata-se inteiramente da correspondência de padrões e outras facetas de como a IA foi concebida.

Ao contrário de erros, falsidades e alucinações de IA, o diabo está nos detalhes para descobrir como manter os preconceitos fora da estrutura da IA ​​ou como detectá-los e lidar com tais facetas.

Vamos explorar como os vieses acabam dentro da IA ​​generativa.

Fontes e métodos que levam a vieses de IA generativa

Quando a IA generativa foi disponibilizada ao público pela primeira vez, os aspectos tendenciosos receberam atenção especial dos especialistas e da mídia. Conforme observado aqui, a IA foi frequentemente retirada do uso público. Além disso, esforços renovados para tentar lidar com os vieses ganharam força adicional.

Alguns assumiram imediatamente que os preconceitos estavam sendo injetados como resultado dos preconceitos dos desenvolvedores de IA e dos pesquisadores de IA que desenvolveram a IA. Em outras palavras, os humanos que estavam desenvolvendo a IA permitiram que seus preconceitos pessoais se insinuassem na IA. Isso foi inicialmente pensado para ser um esforço consciente para influenciar a IA em direções de preferência enviesadas. Embora isso possa ou não ocorrer, outros sugeriram que os vieses podem ser infundidos involuntariamente, ou seja, que os desenvolvedores de IA e os pesquisadores de IA estavam ingenuamente inconscientes de que seus próprios vieses estavam absorvendo o desenvolvimento da IA.

Esse caminho singular ou unidimensional de preocupação dominou a atenção por um tempo.

Eu repetidamente expressei que existe realmente uma ampla gama de fontes e métodos que podem acabar infundindo vieses na IA generativa, conforme discutido em o link aqui. Este é um problema decididamente multidimensional.

Eu trago isso porque a ideia de que os desenvolvedores de IA ou pesquisadores de IA sozinhos são os culpados é uma visão enganosa e estreita da totalidade do problema. Não estou dizendo que eles não são uma fonte potencial, estou simplesmente enfatizando que eles não são a única fonte potencial. Às vezes, perdemos a floresta pelas árvores, fazendo isso fixando estritamente nosso olhar em uma árvore específica.

Conforme abordado extensivamente em minhas colunas, aqui está minha notável lista abrangente de caminhos de polarização que precisam ser totalmente explorados para toda e qualquer implementação de IA generativa:

  • Vieses nos dados de origem da Internet que foram usados ​​para treinamento de dados da IA ​​generativa
  • Vieses nos algoritmos de IA generativos usados ​​para correspondência de padrões nos dados de origem
  • Vieses no design geral de IA da IA ​​generativa e sua infraestrutura
  • Vieses dos desenvolvedores de IA implícita ou explicitamente na formação da IA ​​generativa
  • Vieses dos testadores de IA implícita ou explicitamente no teste da IA ​​generativa
  • Vieses do RLHF (aprendizado por reforço por feedback humano) implícita ou explicitamente pelos revisores humanos designados que transmitem orientação de treinamento à IA generativa
  • Vieses da facilitação de campo de IA para o uso operacional da IA ​​generativa
  • Vieses em qualquer configuração ou instruções padrão estabelecidas para a IA generativa em seu uso diário
  • Vieses propositalmente ou inadvertidamente incluídos nos prompts inseridos pelo usuário da IA ​​generativa
  • Vieses de uma condição sistêmica versus uma aparência ad hoc como parte da geração de saída probabilística aleatória pela IA generativa
  • Vieses que surgem como resultado de ajustes em tempo real ou em tempo real ou treinamento de dados que ocorre enquanto a IA generativa está em uso ativo
  • Vieses introduzidos ou expandidos durante a manutenção de IA ou manutenção do aplicativo generativo de IA e sua codificação de correspondência de padrão
  • Outros

Reflita sobre a lista por um momento ou dois.

Se você de alguma forma eliminar qualquer chance de vieses serem introduzidos por meio dos desenvolvedores de IA ou pesquisadores de IA, ainda será confrontado com uma infinidade de outros meios que podem inevitavelmente abranger vieses. Concentrar-se em apenas um ou mesmo em alguns dos vazamentos potenciais é insuficiente. Todos os outros caminhos fornecem oportunidades adicionais para que os vieses se infiltrem na imagem.

Livrar-se dos vieses generativos da IA ​​é semelhante a uma jogada complexa e complicada de bater uma toupeira.

TruthGPT e as opções de tratamento de viés

Cobrimos o aspecto de que lidar com erros, falsidades e alucinações de IA está em andamento e você pode esperar um dilúvio contínuo de anúncios sobre os avanços da IA ​​lidando com esses problemas.

O mesmo não é tão fácil quanto à questão dos vieses.

O que um TruthGPT pode fazer ou ser planejado para fazer sobre preconceitos?

Considere estas três opções possíveis:

  • 1) Vale tudo. Desenvolva a IA generativa para jorrar qualquer coisa sem qualquer aparência de filtragem associada a vieses. Deixe tudo sair.
  • 2) Permitir configurações para vieses “preferidos”. Desenvolva a IA generativa para produzir vieses considerados “preferidos ou favorecidos” de acordo com aqueles que concebem, colocam ou usam a IA generativa.
  • 3) Sem preconceitos permitidos. Desenvolva a IA generativa que nenhum viés de qualquer tipo seja permitido, de modo que, em todos os momentos e em todos os tipos de uso, nunca haja vieses expressos em nenhum dos ensaios produzidos.

Sem dúvida, você pode imaginar os protestos e as controvérsias associadas a cada uma das opções acima. É provável que nenhuma das opções seja totalmente satisfatória. Todos eles têm seus próprios demônios e armadilhas.

Eu abordo isso a seguir.

Para o Anything Goes Com a opção de IA generativa, os vieses estariam continuamente na frente e no centro. O redemoinho de protesto e desprezo da sociedade seria enorme. Isso aparentemente causaria imensa pressão para fechar a IA generativa. Você também pode facilmente imaginar que reguladores e legisladores seriam estimulados a agir, buscando estabelecer novas Leis de IA para acabar com esse tipo de IA generativa.

No caso do Permitir configurações opção de IA generativa, a noção é que alguém decide quais vieses está aceitando. Pode ser que a empresa que desenvolve a IA defina os parâmetros. Pode ser que a empresa que implementa a IA generativa defina os parâmetros. Outra ideia que está sendo lançada é que cada usuário seria capaz de escolher seus conjuntos preferidos de preconceitos. Quando você usa pela primeira vez uma IA generativa, talvez sejam apresentadas opções ou você pode alimentar suas preferências no aplicativo de IA durante a configuração.

Esta última abordagem pode parecer agradável a todos. Cada pessoa receberia quaisquer preconceitos que preferisse ver. Caso encerrado. Claro, é improvável que isso seja tão bem-vindo ao todo. A noção de que as pessoas podem estar imersas em preconceitos e usar IA generativa como uma espécie de câmara de eco para esses preconceitos certamente despertará angústia social.

Finalmente, no caso do Sem preconceitos opção, isso soa bem, mas levanta uma série de problemas associados. Vamos reexaminar a circunstância da IA ​​generativa que produz um ensaio com comentários positivos sobre um determinado líder político. Pode ser que alguns vejam isso como um ensaio verdadeiro e sem viés. Por outro lado, pode haver outros que insistem que este é um ensaio tendencioso, uma vez que exagera indevidamente os aspectos positivos ou falha em fornecer os negativos de contrapeso para oferecer uma perspectiva equilibrada. Isso ilustra o enigma dos preconceitos.

Veja bem, erros como dois mais dois igual a quatro ou cinco são relativamente fáceis de lidar. Falsidades como o ano de nascimento errado declarado para um presidente são relativamente fáceis de esclarecer. Alucinações de IA, como o uso de um avião a jato em 1800, também são relativamente aparentes para lidar.

Como a IA generativa deve ser concebida para lidar com preconceitos?

Uma pergunta alucinante, com certeza.

TruthGPT quanto à viabilidade e realidade disso

Vamos jogar um jogo.

Suponha que TruthGPT tenha como objetivo ser o tipo de IA generativa que presumivelmente não terá nenhum viés. É absoluta e indiscutivelmente ausente de viés. Além disso, não importa o que o usuário faça, como inserir declarações tendenciosas ou tentar incitar a IA generativa a produzir ensaios carregados de viés, a IA generativa não o fará.

Como um aparte, você pode quase instantaneamente se perguntar como esse tipo de IA generativa lidará com questões de natureza histórica. Imagine que alguém pergunte sobre o tema dos preconceitos políticos. Isso está sob a égide de “vieses” e, portanto, a IA generativa indicaria que não responderia à consulta? Até onde vai essa toca de coelho?

De qualquer forma, se assumirmos para fins de ponderação consciente que TruthGPT será o Sem preconceitos variante da IA ​​generativa, temos que considerar estes resultados:

  • Impossível
  • Possiveis
  • Outros

Os resultados consistem em ser um impossível objetivo e, portanto, não será alcançado. Ou o objetivo é possível mas pode ter algumas rugas sérias. Eu também incluí um Outros resultado para encapsular alguns intermediários.

Primeiro, vamos discutir a impossibilidade. Se a tarefa ou projeto for impossível, você pode estar inclinado a insistir para que não seja tentado. Não faz sentido perseguir algo que é impossível. Bem, pensando um pouco mais sobre isso, a impossibilidade de fato tem algum lado positivo associado a ela. Permita-me explicar.

Aqui estão as possíveis razões pelas quais o TruthGPT pode ser impossível de concretizar e, ainda assim, vale a pena empreender:

  • 1) Impossível porque a missão ou visão nunca pode ser alcançada
  • 2) Impossível, mas vale a pena fazer de qualquer maneira pelo potencial benefício colateral de contribuições notáveis ​​para o avanço da IA ​​ao todo
  • 3) Impossível, porém, pode servir como bonança para chamar a atenção por ter tentado
  • 4) Impossível e mudará seu tom e girará ou falsificará o objetivo original pretendido
  • 5) Impossível, mas reunirá os melhores talentos de IA e ajudará a minar a concorrência
  • 6) Outros

Da mesma forma, podemos supor que estes são alguns dos aspectos TruthGPT para o resultado ser alcançável ou possível de alcançar:

  • 1) Possível e produzirá uma realização oportuna e irrefutavelmente bem-sucedida
  • 2) Possível, mas levará muito mais tempo e será muito mais caro do que o previsto
  • 3) Possível, porém, o resultado ficará muito aquém do objetivo pretendido
  • 4) Possível, mas tardiamente e embaraçosamente eclipsado por outra IA generativa fazendo isso também
  • 5) Possível, porém, o caos interno e as dificuldades de liderança tornam as coisas feias e impróprias
  • 6) Outros

E para completar a lista, aqui estão algumas das outras considerações:

  • 1) Outra é que tudo isso é conversa e nada de ação, nunca começa
  • 2) Outros, como a Lei da IA, a Ética da IA ​​legal ou social lança uma chave no esforço
  • 3) Outro pode ser que o esforço seja vendido/comprado por outros que desejam a IA ou o talento
  • 4) Outro pode consistir em um arranjo colaborativo surpresa em vez de um autônomo
  • 5) Outros curingas, incluindo descobertas chocantes e alimentam o risco existencial da IA
  • 6) Outros

Devido a restrições de espaço aqui, não entrarei nos detalhes de todas essas permutações. Se o interesse do leitor for suficientemente despertado, terei prazer em cobrir isso com mais detalhes em uma coluna posterior.

Conclusão

George Washington supostamente disse: “A verdade acabará prevalecendo onde houver esforços para trazê-la à luz”.

Lidar com os aspectos tendenciosos da IA ​​não é apenas uma questão tecnológica que é resolvida por meio de uma correção tecnológica. As dores prováveis ​​para trazer à tona um senso de “verdade” por meio da IA ​​generativa são muitas. Você pode esperar que a Ética da IA ​​e a Lei da IA ​​sejam uma parte essencial para descobrir para onde tudo isso está indo.

Há uma batida na porta da cabine.

Pode ser que do lado de fora da porta haja (de acordo com o boato):

  • VerdadeGPT
  • HonestGPT
  • GPT falso
  • GPT desonesto
  • ConfusoGPT
  • Confuso GPT
  • AleatórioGPT
  • Etc.

Buda pode fornecer alguns insights sobre este assunto: “Existem apenas dois erros que uma pessoa pode cometer ao longo do caminho para a verdade; não indo até o fim e não começando. Nos esforços de avanço rápido da IA, devemos nos perguntar se estamos cometendo esses erros e, em caso afirmativo, o que deveríamos fazer a respeito.

E essa é a verdade honesta.

Fonte: https://www.forbes.com/sites/lanceeliot/2023/03/06/can-elon-musk-succeed-in-developing-generative-ai-chatgpt-knockoff-truthgpt-that-would-be- estoicamente-verdadeiro-sempre-pergunta-ai-ética-e-ai-lei/