O que o novo Text-To-3D da Nvidia significa para engenharia e design de produtos

tl dr dr: A IA generativa está evoluindo em um ritmo empolgante. O algoritmo mais recente da Nvidia converte texto em malha 3D duas vezes mais rápido do que projetos publicados há apenas 2 meses. Isso significa que as capacidades técnicas já estão superando nossa capacidade de trabalhar com elas.

Últimas semanas papel por cientistas da Nvidia demonstraram a velocidade exponencial na qual o espaço generativo de IA está evoluindo. Essa explosão de atividade – especialmente visível nos últimos 9 meses – terá um impacto em todas as áreas da vida, principalmente no design, engenharia e produção de produtos. As mudanças libertarão a indústria de restrições estruturais na forma como as ideias são comunicadas, capacitarão ciclos de inovação mais rápidos e, finalmente, permitirão que ela cumpra suas promessas de sustentabilidade.

Tendo ouvido por anos que a IA revolucionaria fundamentalmente a maneira como trabalhamos, poucos esperavam que o setor criativo estivesse entre suas primeiras vítimas. O advento do gerador de texto semelhante ao humano do GPT-3 em 2020 trouxe as possibilidades para um foco mais nítido. Tem sido um passeio selvagem desde então: DALL-E (texto para imagem), Whisper (reconhecimento de fala) e, mais recentemente, Stable Diffusion (texto para imagem) não apenas aumentaram os recursos de fala e ferramentas visuais de IA, mas também reduziu os recursos necessários para usá-los (de 175 bilhões de parâmetros para GPT-3 para 900 milhões para difusão estável).

O tamanho do Stable Diffusion significa menos de 5 GB de espaço em disco – capaz de ser executado em qualquer laptop. Não apenas isso; ao contrário do OpenAI (que é financiado principalmente pela Microsoft e publica GPT-3, DALL-E e Whisper), o Stable Diffusion é de código aberto, o que significa que outros podem aproveitar seus aprendizados com muito mais facilidade. Isso significa que estamos vendo apenas o início do ciclo inovador – há muito mais por vir, como mostra o artigo da Nvidia agora.

Os patrocinadores da Stable Diffusion (stability.ai) estão turbinando ainda mais essa tendência, fornecendo subsídios tecnológicos e financeiros para outras equipes que levam a exploração em novas direções. Além disso, uma infinidade de projetos está disponibilizando as ferramentas para uma gama cada vez maior de usuários. Entre eles estão os plug-ins para o Blender, uma ferramenta de design de código aberto, e o equivalente proprietário do Adobe, o Photoshop. O acesso total à API às ferramentas está sendo financiado com grandes dólares de capital de risco, o que significa que centenas de milhões de desenvolvedores de software, não apenas algumas centenas de milhares de engenheiros de dados, agora criarão suas próprias ferramentas nesses algoritmos.

Fala, imagens e texto estão entre os primeiros verticais a serem interrompidos por essas tecnologias. Mas o 3D não fica muito atrás. Além da arte generativa de nicho, os desenhos animados são o primeiro ponto de aplicação óbvio. Já existe um gerador de Pokémon baseado em Stable Diffusion. Os efeitos visuais e os filmes são os próximos. Mas é provável que muitos outros setores sejam interrompidos – entre eles o design de interiores com a Interiorai.com liderando o ataque.

Em meio a toda essa empolgação, aplicar as inovações ao Design & Engineering parece uma reflexão tardia. No entanto, é provável que seja a área mais significativamente impactada. Claro, existem desafios iniciais: Por um lado, Stable Diffusion e seus compatriotas ainda não são muito precisos. Isso não é um problema para desenhos animados, mas é um grande desafio para qualquer tentativa de transformar texto em geometrias 3D completas usadas em contextos industriais. Essa é uma área que teve algum interesse nascente (um projeto chamado Bits101 foi lançado em Israel em 2015). Este pode ser o santo graal da indústria, mas existem muitos desafios intermediários que podem ser muito mais fáceis de resolver. Isso inclui reconhecimento aprimorado de objetos (o algoritmo Yolo já está sendo usado com grande efeito), o que levará a cotações e anotações aprimoradas – melhorando a qualidade e reduzindo erros. Os plug-ins também devem facilitar o uso do Generative AI para desenvolver designs básicos (primitivos), que podem ser editados posteriormente em ferramentas de design para melhorar a tolerância conforme o requisito. Essa é uma abordagem já usada no Inspire de Altair, que usou a Análise de elementos finitos para fazer o mesmo. Esses primitivos também podem servir como banco de dados sintético de modelos anotados, dos quais há escassez na indústria de CAD 3D. CEO e fundador da Physna aponta isso em um artigo detalhando suas próprias tentativas de usar esses novos métodos para criar projetos 3D detalhados, o que também destaca uma série de armadilhas no uso de dados sintéticos para conduzir esses algoritmos A criação de projetos 3D a partir de desenhos 2D é outra área de aplicação potencial, assim como o CAM inteligente biblioteca de desgaste de ferramentas para determinar as melhores estratégias de usinagem.

Esses desafios são importantes e lucrativos para enfrentar em si mesmos. No entanto, seu principal impacto será ajudar a evoluir o caminho da ideia ao design, reduzindo a dependência de designs 3D para comunicar a intenção. Os projetos, sejam 2D ​​ou 3D, serviram como o principal meio de traduzir as necessidades dos clientes em produtos finais. Isso restringe a indústria porque esses projetos servem como uma caixa preta na qual todos os valiosos insights do cliente, restrições de fabricação e objetivos da empresa são armazenados, incapazes de serem desembaraçados, mas identificados sozinhos. Isso significa que, quando algo muda, é quase impossível simplesmente ajustar o design. Esta é a razão pela qual as inovações de fabricação, como a impressão 3D, levam tanto tempo para serem adotadas e sempre desapontam os investidores de curto prazo. Os componentes que compõem uma aeronave são “fixados” desde o momento em que são projetados, apesar de uma vida produtiva de mais de 20 anos. Quase não há espaço para inovações – elas devem aguardar o lançamento da próxima geração.

Ser capaz de alterar uma única restrição e permitir que um algoritmo como Stable Diffusion reconstitua os parâmetros de design e produção acelerará significativamente a adoção de novas inovações e nos permitirá construir produtos mais leves e com melhor desempenho, mais rapidamente. Como fazem na Fórmula 1 ou no Design de Sistemas, os futuros engenheiros atuarão como gerentes de restrições capazes de expressar em palavras e em referência a fontes de dados quais são os objetivos e as limitações do produto.

Sem acelerar o processo de engenharia para produtos novos e existentes dessa maneira, quase não temos meios de atingir as ambiciosas metas de sustentabilidade que devemos estabelecer para nós mesmos. Para fazer isso, devemos primeiro concordar com uma linguagem que possamos usar para nos comunicar além dos designs. Esse novo modelo semântico é a lacuna óbvia nas inovações descritas acima. Várias empresas já começaram a experimentá-lo, como nTopologia com seus conceitos de Campos. E, no entanto, o ritmo da mudança é lento, ao contrário dos algoritmos que o modelo semântico alimentará. O novo algoritmo da Nvidia é supostamente duas vezes mais rápido que DreamFusion, publicado há menos de 2 meses. As empresas de produtos e engenharia precisam trabalhar para capturar suas ideias de maneiras novas e preparadas para o futuro, a fim de aproveitar ao máximo as possibilidades que essa explosão de IA generativa oferece. A velocidade da mudança nos algoritmos mostrou, mais uma vez, que a Lei Morse se aplica a todos os lugares onde as ferramentas estão sendo digitalizadas. O desafio continua sendo nossa incapacidade humana de abraçar essa mudança e implantar novos métodos de comunicação capazes de liberar seu potencial, apesar da urgência da tarefa.

Fonte: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/