|
NOTAS SOBRE UM ARQUITECTO ARTIFICIALMENTE INTELIGENTE
VÃTOR ALVES
Como Neil Leach observa no seu mais recente livro Architecture in the Age of Artificial Intelligence: An Introduction AI for Architects (2022), há muito que os algoritmos fazem parte do quotidiano de muitos de nós, escolhendo quem são os nossos amigos (Facebook), o que devemos comprar (Amazon), sugerindo até os nossos parceiros sexuais (Tinder). Parece que esta inteligência expandida nos conhece melhor que nós próprios, apelando ao íntimo de cada um. Acontece que nos últimos meses, plataformas que existem há já algum tempo, adquiriram um renovado interesse e atenção muito para lá dos nichos a que estavam confinados. ChatGPT, Midjourney, Stable Diffusion ou DALL-E, não só começaram a aparecer com destaque nos media generalistas [1] como conquistaram alguma atenção e protagonismo nos meios especializados, arquitectura incluída [2]. Subitamente acordou-se para a potência da Inteligência Artificial (AI em inglês), apesar de se ter convivido com ela durante anos.
Mesmo que a designação não seja consensual, adquirindo subtilezas significativas consoante o círculo a que pertencem, a AI conquistou uma centralidade na discussão disciplinar que vai muito para além de uns quantos geeks que se divertem na interacção com bots, com particular atracção na produção de imagens espetaculares e simulação de cenários alternativos. Uma apetência visual explicada não só pelo fascínio que tais imagens produzem ou a facilidade com que são feitas, sem esquecer a cativante verosimilhança com o real e a gratificação imediata que proporcionam, mas também pelo meio privilegiado que utiliza para a sua divulgação. A internet é chão fértil e propício para a produção de conteúdos visuais, muito mais do que textuais, mais aptos a ultrapassarem fronteiras culturais e linguísticas. Ainda que o verdadeiro potencial da AI não se limite somente à organização de pixéis de forma apelativa, tal como demonstra Neil Leach em Architecture in the Age of Artificial Intelligence, talvez seja relevante atentar nas potenciais transformações produtivas destas ferramentas de processamento de imagens.
Como o autor refere, tudo o que os arquitectos actualmente fazem, a AI fará melhor, mais rápido e com maior rigor, sobretudo em termos técnicos e desde que sejam traduzíveis em dados quantitativos. O que parece ser uma coisa positiva principalmente naqueles casos em que pode melhorar, por exemplo, qual a dimensão mais eficiente dos vãos tendo em conta determinada orientação solar através do cálculo de múltiplas variações possíveis. No entanto, quando se considera o mercado neoliberal no qual a maior parte da produção do projecto se insere, é fácil de antever uma drástica mudança na configuração dos meios de produção e das tarefas dos arquitectos. Se estas ferramentas tornam o trabalho mais produtivo, talvez importe interrogar quem serão os benificiários deste “progresso”. Aliás, o próprio Leach interroga-se se 80% dos empregos em arquitectura não estarão em risco devido a esta eficiência [3]. Ignorar a aparente inevitabilidade da utilização alargada da AI na arquitectura e o seu impacto disciplinar – e também no ambiente construído – não parece ser uma hipótese. Mas se as ferramentas de processamento de imagens (tanto os text-to-image como os image-to-image), ou “alucinações” como são muitas vezes designadas as imagens produzidas por inteligência artificial (machine hallucinations), podem ajudar a compreender como funciona a mente humana e os arquitectos pensam através da “arquitectualização” do mundo [4] e de algum modo esclarecer a dúvida de Mark Wigley sobre o que se passa num gabinete de arquitectura [5], será que também apontam para o que se espera dos arquitectos no futuro (próximo)?
As “alucinações” produzidas pela AI funcionam recorrendo às Neural Networks (NN). De uma maneira simplista, estas redes operam numa base probabilística que determinam uma relação entre os dados que são fornecidos e o resultado correcto – por exemplo, estabelecer a correspondência entre a imagem de um gato e a palavra “gato” – com base numa aprendizagem prévia. [6] O DeepDream, ainda de modo simplista, funciona no sentido inverso: fornecendo a palavra “gato” produz-se uma imagem que se parece com um gato tendo por base aquilo que o dispositivo aprendeu como sendo “gato”. [7] As imagens que mais têm atraído a atenção mediática são as “alucinações” produzidas pelas Generative Adversarial Networks (GANs) e que articulam os dois procedimentos anteriores, com resultados mais fidedignos e com maior resolução. Ainda correndo o risco de um excesso de simplificação, poder-se-ia resumir o procedimento das GAN como a disputa entre duas NN diferentes: um gerador de imagens – o “artista” – e um discriminador – o “crítico” – que avalia essas mesmas imagens tendo como referência os exemplos no qual foi treinado [8]. Neste confronto – que em rigor é um processo dialético em que cada uma das NN está constantemente a aprender e evoluir em conjunto com a outra –, o gerador tenta “enganar” o discriminador ao produzir imagens tão convincentes que este não as consiga distinguir das “verdadeiras” e no qual resulta a imagem final. Apesar da brevidade desta descrição e inevitável incompletude, importa, ainda assim, destacar apenas alguns aspectos do funcionamento destas tecnologias.
Um deles tem que ver com a aprendizagem das plataformas. Tanto as NN como o DeepDream e as GANs, estabelecem os seus resultados a partir de um conjunto de dados previamente fornecidos. O que significa que a “resposta” a qualquer solicitação está de algum modo contida nas informações existentes sendo posteriormente inferido ou deduzido, mesmo que esse resultado aparente ser em tudo diferente. O que por sua vez sugere que essas “respostas” são de algum modo reformulações do existente e não uma efectiva alternativa ao que já se conhece. Este parece ser o resultado, pelo menos para já e apenas para dar um exemplo, do projecto Deep Himmelblau [9], que oferece “novas” imagens a partir do remix de obras dos Coop Himmelb(l)au. Mas também, e talvez de uma forma mais problemática, no modo como perpetua algumas parcialidades e estereótipos como refere Melissa Heikkilä [10]. Segundo a autora, plataformas como Stable Diffusion, ao recolherem da internet as imagens que têm como referência, acabam por reproduzir o mesmo padrão, preservando olhares altamente deformados da realidade [11]. Ou seja, o “crítico” GANiano não tem qualquer capacidade de juízo, qualquer capacidade de agência, não é um crítico em sentido pleno – e o mesmo talvez se possa dizer do “artista” –, mas apenas uma “figura” que avalia somente a habilidade ilusória da imagem. Seguindo esta linha de raciocínio talvez importe perguntar se mais do que oferecer alternativas, não estarão estas plataformas a impossibilitar um futuro outro?
A questão da aprendizagem também é pertinente em plataformas que são treinadas em sistemas fechados (que diferem dos abertos que recolhem a sua informação da internet), não tanto pela ausência de parcialidade, mas por causa dela. Desenvolvendo uma espécie de apofenia artificial, vêem apenas aquilo em que foram treinadas para ver. Por exemplo, se foram treinadas a ver flores, quaisquer que sejam os dados de entrada (a imagem de um molho de chaves ou um carregador de telemóvel), embora reagindo a eles, o resultado será sempre o mesmo: flores [12]. Nestes casos, o interesse advém pelo modo como forçam o resultado final apontando, numa mesma direcção, uma infinidade hipóteses. Esta é uma das opções escolhidas por Morphosis: a exploração de múltiplas combinações possíveis tendo como ponto de partida um estudo inicial [13]. Apesar dos limites do jogo probabilístico, não deixa de surpreender a sedutora capacidade que reside no cálculo de previsibilidades.
Um outro aspecto que também importa destacar e que é transversal ao funcionamento destas plataformas é a centralidade da escolha. Uma das características da AI é a capacidade que tem de analisar uma imensa quantidade de dados, executar uma quantidade de cálculos sem limite e apresenta-los em segundos. Rapidamente disponibiliza diferentes opções, que se renovam a cada novo click. No entanto, como refere Mario Carpo, só as tarefas mensuráveis por dados quantitativos é que podem ser optimizadas e, mesmos estas, provavelmente dependem de mais do que um parâmetro que por sua vez pode adquirir uma importância relativa [14]. Neste contexto, e pelo menos no momento actual, o que parece ser determinante não é tanto a capacidade da execução da tarefa em si, mas a definição da prioridade dos parâmetros aos quais a AI obedece. E claro, qual o resultado final que se aceita. Em ambos os casos, o ônus ainda recai no manipulador humano.
Neste cenário de prevalência das tecnologias da AI aplicadas à arquitectura, serão as ferramentas da curadoria, edição e da crítica os instrumentos necessários deste arquitecto-outro, onde a selecção pertinente, escolha justificada e o olhar crítico são mais úteis do que a capacidade do seminal gesto? Será que aquilo que se espera desse arquitecto artificialmente inteligente é o domínio e prioridade desses instrumentos habitualmente afastados do centro disciplinar – pelo menos quando se considera a perspectiva mais tradicionalista da arquitectura onde impera a prática do desenho o olhar pessoal e único sobre a realidade a intervir, desenvolvendo uma arquitectura de autor? E que consequências terá esta reorganização de prioridades? Certamente que é razoável argumentar que às soluções apresentadas pelas plataformas de AI, mesmo com aparente sentido formal, falta uma compreensão do conteúdo. No entanto, a sua sofisticação é cada vez maior, cada vez mais atenta a subtis particularidades que, ainda que definida por modelos probabilísticos, nunca tinham sido produzidas (será que faz sentido falar de criatividade e inovação aqui?). Mesmo que a máquina não constitua uma alteridade, não é difícil imagina-la como um outro, com todos os problemas que daí poderão advir. Mas talvez seja esta uma questão pertinente: de que é que estamos à espera que aconteça: que a máquina seja realmente inteligente ou não? E o que acontecerá se essa expectativa tiver uma correspondência efectiva ao que se deseja?
>>>
Notas:
[1] Oscar Holland, “An architect asked AI do design skyscrapers of the future. This is what it proposed”, in CNN (Setembro, 2022).
[2] Filipe Alves, Luca Martinucci, Pedro Bandeira, “Capriccio on repeat: A imagem na era da Inteligência Artificial”, in Jornal Arquitectos #263 (Fevereiro, 2023), pp. 72-84.
[3] Neil Leach, “AI is putting our jobs as architects unquestionably at risk”, in Dezeen (Fevereiro, 2023).
[4] “The concept of ‘architecturalisation’ is introduced here to describe how architects have a tendency not only to translate elements of nature into architectural forms, but also to translate abstract philosophical concepts into architectural forms, often leading to a profound misunderstanding of those concepts.” Neil Leach, “Machine Hallucinations: Architecture and Artificial Intelligence”, in AD, volume 92, edição 3 (Maio/Junho 2022), pp. 66-71.
[5] “Não há uma explicação sã, razoável, credível para o que acontece num gabinete de arquitectura, mas o gabinete é certamente ele próprio obra da inteligência arquitectónica. [...] mas passam-se os séculos e continuamos sem saber que coisa é essa que estamos sempre a fazer.” Mark Wigley [entrevista por Joaquim Moreno], “Bem-vindos ao vácuo”, in Jornal Arquitectos #239 (Abril/Maio/Junho 2010), p. 34.
[6] Neil Leach, Architecture in the Age of Artificial Intelligence: An Introduction AI for Architects, Londres: Bloomsbury, 2022, pp. 21-23.
[7] Idem, pp. 25-26. É de sublinhar de que a imagem produzida não é um gato específico, real, que existe ou que existiu, mas um resultado destilado das imagens designadas como “gato” durante o processo de aprendizagem do programa, e que nem sempre se parece com um gato.
[8] Idem, pp. 26-27. Os termos “artista” e “crítico” fazem parte do vocabulário usado pelos cientistas para descrever as funções de gerador e discriminador.
[9] Projeto Deep Himmelblau.
[10] Melissa Heikkilä, “These new tools let you see for yourself how biased AI image models are”, in MIT Technology Review (Março, 2023).
[11] Melissa Heikkilä, “The viral AI avatar app Lensa undressed me—without my consent”, in MIT Technology Review (Dezembro, 2022).
[12] "Learning how to see".
[13] "
[14] Mario Carpo, “A short but believable history of the digital turn in architecture”, in e-flux (Março, 2022)
:::
Vítor Alves
Arquitecto, investigador (CEAA), docente (ISMAT) e coordenador redactorial do Jornal Arquitectos.