Maurizio Vivarelli
Il libro che verrà discusso in questo contributo è L’architetto e l’oracolo di Gino Roncaglia1, e cominciamo a cercare di capire in primo luogo come questo libro è fatto, a partire dai suoi elementi paratestuali.
La copertina è stata realizzata con Midjourney, uno dei più noti sistemi di intelligenza artificiale per la generazione di immagini, con un prompt le cui parole chiave sono ‘copertina’, ‘rete neurale’, ‘enciclopedia’, ‘biblioteca’, ‘stile Bauhaus’, che già si qualificano come i concetti centrali sviluppati nella trattazione; concetti che si ritrovano sostanzialmente nel titolo, reso particolarmente efficace dalla esplicita polarizzazione tra due termini dissonanti, ‘architetto’ ed ‘oracolo’, in grado di evocare non solo metodi da utilizzare per l’organizzazione della conoscenza, ma anche l’intrigante campo dell’immaginario sviluppato nella celebre trilogia del film Matrix, diretto nel 1999 dagli allora fratelli Wachowski, in cui l’architetto, uomo, e l’oracolo, donna, si integrano per la produzione di quel problematico modello di realtà.
Le citazioni in esergo forniscono ulteriori tracce per orientarsi nei contesti e nel testo del libro. La prima, tratta dall’Enciclopedia Britannica, evoca la mitica enciclopedia voluta dall’imperatore cinese Young Lo per raccogliere ed ordinare tutto il sapere del mondo; la seconda richiama Wikipedia; la terza dà conto della estensione indeterminata dei Large Language Models (LLM), in un vertiginoso crescendo quantitativo degli elementi – i caratteri delle parole utilizzate – che passano da 350 milioni a quattro miliardi, fino ad arrivare alle molte centinaia di miliardi dei corpora di addestramento degli LLM.
Esaurita questa fase, preliminare ed evocativa, l’indice descrive l’articolazione dei contenuti del libro, affidata alla familiare rappresentazione in un ordinario spazio tipografico che, già a questo punto, possiamo immaginare sospeso nella sterminata estensione dell’infosfera.
La parte I serve anzitutto per istituire elementi di continuità con le riflessioni proposte da Roncaglia in L’età della frammentazione2, in cui era stata proseguita l’indagine, ormai pluridecennale, sulle caratteristiche evolutive degli ecosistemi digitali, mettendo a fuoco, in particolare, «la progressiva tendenza all’aumento di contenuti brevi e alla diminuzione di contenuti complessi», giudicata «un fattore che dovrebbe preoccuparci in quanto rischia di ridurre la nostra capacità di comprendere la realtà» (p. 9). Proprio qui si situa una delle assunzioni teoriche più importanti del libro, e cioè l’invito esplicito ad andare oltre la tentazione di considerare la frammentazione e la granularità attributi essenziali e tipici degli ecosistemi digitali, generando una contrapposizione ingenua ed errata tra incanto edenico predigitale e straniamento apocalittico di un mondo digitale che, chiarisce opportunamente Roncaglia, non è altro, in quanto tale, che «un formato di codifica dell’informazione» (p. 10).
L’obiettivo deve dunque consistere nella riappropriazione di competenze di complessità auspicabilmente stabili, in grado di favorire un orientamento senza pregiudizi nella complessità del presente, e nelle tensioni e criticità che lo caratterizzano, e che necessariamente riguardano anche la forma totemica dell’oggetto-libro, nella cui morfologia si è codificata per millenni la rappresentazione esteriorizzata della conoscenza. In questo modo si precisa la domanda di ricerca centrale che L’architetto e l’oracolo pone: in che modo è possibile continuare a costruire contenuti complessi negli attuali ecosistemi digitali? La risposta dell’autore, come vedremo, è che sì, si può, consapevoli delle problematiche e delle difficoltà, se riusciamo prima a comprendere, e poi ad integrare gli apporti dei due modelli di organizzazione della conoscenza, quello sistematico ed enciclopedico, e quello ottenuto con una produzione generativa di contenuti prodotti dai movimenti irregolari dell’oracolo.
Negli altri capitoli della parte I vengono rapidamente perlustrati alcuni tentativi di sistematizzazione del sapere, richiamandosi alle intuizioni visionarie di H. G. Wells e di Albert Ducrocq, e alle forme delineate con le edizioni multimediali e digitali di rilevanti esperienze enciclopediche, dal pionieristico Bookshelf di Microsoft (1987) a Encarta (1993) a Encyclomedia (1995-96), per approdare infine all’esperienza di Wikipedia, iniziata nel 2005, in un periodo in cui emerge e di lì a poco si afferma la fisionomia del web sociale, con il debutto di strumenti ed ambienti come Facebook e YouTube.
A Wikipedia sono dedicate considerazioni sintetiche attente, a partire dalla presa d’atto che la divergenza tra l’autorevolezza, la qualità, l’affidabilità delle voci pubblicate, comparate con quelle della monumentale Encyclopedia Britannica, risulta alla prova dei fatti minima, proprio grazie ai meccanismi di produzione collaborativi con i quali Wikipedia è realizzata.
La parte I si chiude con una breve trattazione di alcune delle principali caratteristiche del web semantico e dei linked open data, che indubbiamente, scrive Roncaglia «hanno […] dato all’architetto strumenti potentissimi per combattere granularità e frammentarietà», pur occupandosi solo di sottoinsiemi selettivi e parziali di informazioni (p. 65).
La parte II abbandona i territori ordinati dall’architetto ed avvia l’esplorazione dei percorsi tracciati dall’oracolo, che cerca di costruire la complessità attraverso uno «sviluppo organico, non perfettamente controllato e controllabile» (p. 69), secondo modalità dunque indeterminate, sia a monte, con componenti superiori non riconducibili deterministicamente alle proprietà delle parti, sia a valle, con elementi così numerosi ed incerti da non poter essere descritti e rappresentati, almeno con gli strumenti resi disponibili dalla tradizione teorica e metodologica della via architettonica.
In questo modo vengono introdotti i ragionamenti proposti sulle intelligenze artificiali generative, sviluppate a partire da basi di conoscenza non strutturate, agendo secondo dinamiche che, a parere di Roncaglia, non sono quelle meramente meccaniche dei ‘pappagalli stocastici’, secondo la celebre espressione utilizzata da Emily Bender nel 2021.
Credo che sia del tutto condivisibile la posizione dell’autore, quando sostiene che questa ulteriore metafora (quella del ‘pappagallo stocastico’) nasconde in realtà una profonda incomprensione del funzionamento degli LLM, che non si limitano a riprodurre meccanicamente i frammenti di testi utilizzati per il loro addestramento, ma producono contenuti testuali sulla base di complessi modelli probabilistici.
La parte del libro dedicata all’IA generativa è verosimilmente quella che ha suscitato l’interesse maggiore dei lettori. In quattro brevi capitoli, in poco più di trenta pagine in tutto, Roncaglia riesce efficacemente a descrivere gli elementi concettualmente più rilevanti delle reti neurali, dall’iniziale modello di McCulloch e Pitts degli anni Quaranta del Novecento fino ai percettroni di Rosenblatt, di qualche decennio successivi, dedicando dense pagine alle modalità con cui le IA generative vengono addestrate per costruire il modello del LLM. I lessemi, cioè gli elementi grafico-linguistici dei dataset adoperati, vengono trasformati in token, cioè in unità più piccole delle singole parole, con variabili che dipendono dal modello di tokenizzazione scelto. Ad ognuno dei token prodotti viene associato uno spazio numerico multidimensionale ed astratto, che esprime i contesti d’uso di ogni singolo token entro il corpus da cui lo stesso token proviene. Questa è la cruciale fase dell’embedding, in cui i singoli token vengono trasformati in vettori numerici che acquisiscono migliaia di connessioni, proprie ed autonome, non correlate alle relazioni sintattiche e semantiche del corpus linguistico dal quale sono stati estratti. In questo modo le relazioni semantiche che, nel linguaggio, le parole hanno tra di loro, sono rappresentate secondo modalità che ne facilitano la “comprensione” e l’uso da parte delle macchine. In questo contesto nel 2017, in ambienti di ricerca di Google, è stata sviluppata l’architettura delle reti neurali basati su transformer, che consente di “pesare” i vettori di ciascun token in relazione a tutti gli altri token del corpus.
Sulla base di questi meccanismi, iterati attraverso moduli denominati encoder e decoder, strumenti come ChatGPT producono, token dopo token, le frasi in linguaggio naturale che vengono proposte in risposta alle diverse tipologie di prompt adoperati dalle persone, basandosi su modelli definiti da Roncaglia di semantica quantitativa (p. 94), che, ben lontana dall’essere deterministica, sembra avvicinarsi al concetto di significato come uso, che come è noto costituisce il nucleo centrale della riflessione filosofica del secondo Wittgenstein nelle Ricerche filosofiche, pubblicate postume nel 1953.
Questo processo, di cui L’architetto e l’oracolo descrive le fasi essenziali, include al proprio interno sia le ben note allucinazioni, cioè gli errori talvolta macroscopici che i sistemi generativi producono, sia i bias, vale a dire i pregiudizi o distorsioni presenti nei testi prodotti, che dipendono evidentemente dai bias presenti nei testi di addestramento.
L’ultimo capitolo della parte II, infine, propone alcune considerazioni sull’impatto sociale delle IA generative rispetto al mondo del libro e dell’editoria.
La parte III prende in esame le modalità con cui i modelli di produzione della conoscenza esaminati, architettonici ed oracolari, influiscono sui meccanismi di produzione delle memorie personali, alla luce della teoria della cosiddetta ‘mente estesa’ (concetto introdotto nel 1998 da Andy Clark e David Chalmers), che prevede l’assunzione che l’io e la coscienza non risiedano solo nella mente e nel cervello, ma che vengano esternalizzate ed esteriorizzate in tutti gli ambienti artificiali utilizzati per estendere le funzioni nella memoria neurobiologica.
L’architetto e l’oracolo si conclude con il richiamo a tre testi classici della letteratura fantascientifica, riferiti a modelli di organizzazione della conoscenza enciclopedici, universalistici, totalizzanti. Il primo esempio proposto è quello della biblioteca di Trantor e della Enciclopedia Galattica immaginate nel celebre “ciclo della fondazione” di Isaac Asimov; il secondo è il romanzo Snow Crash di Neal Stephenson, che descrive gli effetti della virtualizzazione dei database della Library of Congress per popolare un selettivo ed esclusivo metaverso entro il quale avvengono gli unici possibili scambi informativi, attraverso strumenti denominato hypercard. Il terzo esempio è il romanzo The virtual librarian di Ted e Bob Rockwell, che descrive una biblioteca digitale cui è possibile accedere attraverso strumenti di realtà virtuale e che, gradualmente, acquisisce capacità di elaborazione autonome ed inaspettate, esprimendole in linguaggio naturale. Visioni, come risulta evidente, che hanno molto a che fare con gli inediti scenari con i quali dobbiamo, nella concretezza della realtà, necessariamente fare i conti.
I ventuno capitoli del libro, distribuiti nelle quattro parti in precedenza descritte, sono brevi e privi di note a piè di pagine, raccolte dopo il testo principale, nel quale sono presenti invece un buon numero di QR code che consentono di accedere a contenuti digitali di approfondimento.
L’architetto e l’oracolo è un libro con una struttura molto articolata, e per questo ho ritenuto necessario in primo luogo descrivere le caratteristiche principali, paratestuali e testuali, della strategia con cui vengono affrontati temi così rilevanti da un punto culturale, socio-tecnico, epistemologico. Gino Roncaglia ha il grande merito di spiegare efficacemente gli argomenti di cui si occupa, ed anche la trasparenza intellettuale di indicare quei nuclei concettuali che, per un motivo o l’altro, non vengono neppure sinteticamente presi in esame. Questa capacità di scrivere chiaramente, e di mostrare un continuo interesse alla effettiva comprensione del testo anche da parte di lettori non specialisti, e di trattare, nello stesso tempo, temi di straordinaria complessità, mi pare uno degli elementi di maggior pregio del volume. Il nucleo centrale del libro consiste dunque nel cercare di capire come la conoscenza viene prodotta, organizzata e comunicata in ambiente digitale, e quali sono gli elementi che caratterizzano i modelli di rappresentazione gerarchico-architettonico e oracolare-probabilistico. Sullo sfondo della trattazione si intravede dunque un sogno persistente della nostra tradizione culturale, quello della descrizione e classificazione universalistica della conoscenza; e, a partire dal sogno, le modalità con cui queste attività si sono concretizzate nei diversi ecosistemi digitali, continuando a costellare gli elementi fondativi di una aspirazione originaria ed archetipa, suggestivamente anticipata già dalle citazioni con cui questo libro si apre.
Nelle traiettorie irregolari di questo sogno si distendono, dualizzandosi, i due corni estremi del problema, con le polarità in apparenza divergenti della frammentazione e della complessità, cercando di salvare le culture digitali dalla attribuzione, ingenuamente distopica, di essere le responsabili uniche del rischio dell’impoverimento della nostra attitudine a comprendere la realtà. In questo senso è chiara la posizione di Roncaglia, che ci invita a interpretare il digitale non come il capro espiatorio delle criticità di una peculiare fase storica - quella della quarta rivoluzione di Luciano Floridi -, ma anche come un possibile farmaco da assumere per migliorare la nostra capacità di attraversare i territori indeterminati e decisamente impervi di un paesaggio, che comunque è di fronte ai nostri occhi. Certo è che la vorticosa crescita quantitativa degli elementi che è necessario ordinare, per ottenere come risultato il metaforico ‘circolo del sapere’ che tutte le enciclopedie ambiscono a circoscrivere, mette in crisi il desiderio universalizzante che è uno dei tratti tipici della cultura bibliografica, anche nella sua dimensione storica. Il sogno antico di una Bibliotheca Universalis può allora essere intuito, immaginato e pensato non più solo nelle forme dei libri, delle collezioni, delle biblioteche, e negli strumenti utilizzati per ordinarle, ma anche nello spazio vettoriale, astratto e matematizzato, in cui avviene la generazione di contenuti da parte delle intelligenze artificiali generative, e dei sofisticati modelli probabilistici con cui i token, le parole, le frasi sono prodotte, a partire da reticoli così complessi che, al confronto, i Mille piani di Deleuze e Guattari sembrano adatti a poco più che un innocente gioco del nascondino.
L’architetto e l’oracolo, proseguendo e consolidando una linea di ricerca fortemente strutturata, approda dunque al cuore di una delle criticità più evidenti che affliggono il desiderio totalizzante di conferire un ordine al sottoinsieme di informazioni che costituiscono la conoscenza. Questo ordine architettonico, riferito ad un insieme selettivo di informazioni, governato principalmente con gli strumenti della razionalità umana, deve ora confrontarsi con una esplosione informativa senza precedenti, che, a sua volta, continua ad alimentare il desiderio di organizzare, semantizzandola, questa indeterminale quantità e varietà di contenuti, che, scrive Roncaglia è tuttavia «talmente veloce da rendere quasi disperato il tentativo di inseguirlo per associare ad ogni informazione la sua brava etichetta» (p. 190). Semantizzare ed ontologizzare la pluralità indefinita degli oggetti che popolano l’infosfera non potrà dunque che far evolvere gli strumenti di cui la nostra specie si è avvalsa per conferire ordine all’eterogeneo. Questa quota di disordine, di fatto non ordinabile con i metodi e le tecniche dell’architetto, non può che cercare di avvalersi del potere computazionale di quelle stesse macchine che, incessantemente, continuano a produrre, ed anche a relazionare, contenuti. Potere computazionale che, nel caso degli LLM, mostra capacità, anche emergenti, di «dominare e riutilizzare grandi quantità di informazioni poco o per nulla organizzate, e di farlo in forme sorprendentemente efficaci» (p. 191).
Il libro di Gino Roncaglia si chiude con questo auspicio, che anche in questa sede mi sento convintamente di rilanciare. L’architetto deve trovare il modo di agire sinergicamente e olisticamente con il suo doppio, l’oracolo, e confrontarsi con i due corni, certamente non antitetici, di questa apparente opposizione dualistica, secondo modalità concretamente ed operativamente collaborative. Un esempio molto concreto di questa integrazione è certamente costituito dai metodi e le tecniche della RAG – Retrieval Augmented Generation, che consentono di applicare la capacità degli LLM a domini specifici, utilizzando basi di conoscenza costruite ad hoc grazie alle quali i contenuti prodotti sono maggiormente pertinenti ed affidabili rispetto a quelli elaborati a partire dai dati di addestramento sui quali è stato costruito il modello di LLM3.
Per l’insieme di questi motivi la cultura bibliografica e biblioteconomica sono invitate, e forse obbligate, a confrontarsi con una riflessione sulla natura dei propri fondamenti, per ripensare i modelli di mediazione informativa sia nella loro dimensione teorica che nelle applicazioni professionali ad essi collegate.
In conclusione, anche per aggiornare i contenuti di un libro che si occupa di temi e questioni che si modificano continuamente e rapidamente, sono state poste a Gino Roncaglia le domande che seguono.
L'architetto e l'oracolo ha avuto una vasta diffusione in ambiente bibliografico e biblioteconomico. Quali aspetti del libro sono stati giudicati particolarmente significativi?
Indubbiamente la sezione su cui ho avuto più reazioni e che ha suscitato maggiore interesse è quella sull’intelligenza artificiale generativa: un tema che all’uscita del libro, nell’ottobre 2023, era abbastanza nuovo, e che continua a essere al centro di un dibattito assai vivace. L’altro aspetto su cui si sono soffermati molti commenti è la doppia metafora dell’architetto e dell’oracolo: naturalmente è solo una metafora, ma la distinzione fra il paradigma architettonico che cerca una organizzazione il più possibile sistematica e ‘controllata’ dei saperi, e il paradigma statistico-probabilistico e predittivo dell’IA generativa, che sfugge a ogni descrizione deterministica, è – credo – una distinzione importante per chi si occupa di mediazione informativa e di organizzazione delle conoscenze. Certo, un sistema di intelligenza artificiale generativa non è totalmente oracolare: per un verso, sappiamo comunque molto sui suoi meccanismi di funzionamento (funzioni di attivazione, pesi, embedding dei token…): più che una scatola nera, potremmo dire che è una scatola grigia. E per altro verso la qualità dei suoi prodotti può variare anche notevolmente in funzione di molti fattori che sono in linea di principio esplicitabili, dalla qualità e quantità del corpus di addestramento alla tipologia e alla mole dell’addestramento supervisionato, dall’architettura della rete neurale al contesto d’uso e ai prompt (e meta-prompt) utilizzati. Ma la differenza di paradigma resta, e va tenuta presente.
Fra le diverse reazioni, mi ha colpito abbastanza il fatto che alcune persone, anche molto competenti nei loro ambiti lavorativi, tendano a considerare l’IA generativa come una sorta di ‘bluff’, un campo di ricerca alla moda ma destinato a sgonfiarsi, i cui risultati sono eccessivamente enfatizzati per ragioni soprattutto commerciali. È una reazione minoritaria, ma comunque abbastanza diffusa. Credo che sia profondamente sbagliata, e che sottovaluti gli enormi risultati ottenuti in un lasso di tempo assai breve (l’architettura a transformer è stata introdotta solo nel 2017). In sostanza, i sistemi di IA generativa che usiamo oggi sono ancora nella loro infanzia, e i moltissimi sviluppi che ci sono stati nell’anno trascorso dall’uscita del libro in settori come la Retrieval Augmented Generation, i modelli multimodali, gli Small Language Models, le metodologie di prompting e il rafforzamento delle capacità logico-deduttive mostrano a mio avviso che nei prossimi anni vedremo ancora novità assai significative. Questo non vuol dire che non possano scoppiare alcune bolle speculative; ricordiamo che la crisi delle dot-com, a fine 2000, ha coinciso quasi esattamente con la fase di più veloce espansione di Internet: anche la situazione e la solidità finanziaria delle società che producono modelli di IA generativa non è necessariamente legata ai risultati della ricerca svolta nel settore.
Il tuo auspicio, nelle Conclusioni, è quello di una collaborazione ed integrazione tra i modelli e gli strumenti dell'architetto e dell'oracolo. Puoi indicare linee di ricerca od esperienze che si muovono in questa prospettiva?
La linea di ricerca più significativa in questa direzione è quella della Retrieval Augmented Generation, che integra strumenti di IA generativa e strumenti più tradizionali di information retrieval, con la finalità di migliorare la qualità dei risultati e di ridurre le allucinazioni. Nell’anno trascorso dalla pubblicazione del libro l’attenzione verso la RAG (che a sua volta include diverse possibili metodologie) è cresciuta esponenzialmente, e la RAG è particolarmente rilevante proprio per poter utilizzare l’IA generativa nei campi che erano tradizionalmente di pertinenza dell’architetto, in cui la precisione delle informazioni fornite è vitale.
Volendo indicare esperienze specifiche, devo dire che mi ha molto colpito quella portata avanti dagli archivi del Parlamento Europeo4, che utilizza proprio la Retrieval Augmented Generation per costruire un sistema affidabile di interrogazione di oltre 100.000 documenti custoditi. L’intreccio fra uso competente del linguaggio naturale e alta personalizzazione delle risposte fornite, da un lato, e accuratezza delle informazioni fornite e delle fonti citate, dall’altro, mostra che l’uso della RAG per promuovere forme di collaborazione fra l’oracolo e l’architetto è effettivamente possibile.
Articolo proposto il 5 aprile 2024 e accettato il 21 maggio 2024.
MAURIZIO VIVARELLI, Università degli studi di Torino, Dipartimento di studi storici, Torino, e-mailmaurizio.vivarelli@unito.it.
Ultima consultazione siti web: 3 novembre 2024
AIB studi, vol. 64 n. 2 (maggio/agosto 2024). DOI 10.2426/aibstudi-14086. ISSN: 2280-9112, E-ISSN: 2239-6152 - Copyright (c) 2024 Maurizio Vivarelli