Rappresentazione, organizzazione e trasmissione della conoscenza: Library and information science e digital humanities

di Simona Turbanti

Questa riflessione prende spunto da due lavori monografici recenti che ricadono nello spettro delle digital humanities1, in particolare sui legami esistenti tra le istituzioni della memoria, le discipline del libro e del documento e il ‘potenziale’ che può derivare da progetti ideati e sviluppati in ambiente digitale.
Il volume di Federico Meschini è incentrato sulle diverse forme acquisite dall’oggetto libro a partire dalla disponibilità delle reti e dei sistemi di interconnessione a distanza; mediante un percorso non sempre lineare e ‘semplice’ – su questo concetto ci soffermeremo più avanti – si viene condotti in ambiti, studi e sperimentazioni tipici delle DH.
Allacciandosi a studi di Gino Roncaglia, l’autore traccia i percorsi compiuti dalla testualità in seguito all’avvento del digitale (anche) nella vita del libro e dei suoi fruitori, la cosiddetta «quarta rivoluzione»2.
L’organizzazione della conoscenza rappresenta il punto di partenza e di arrivo del lavoro di Francesca Tomasi, nonché la principale finalità delle discipline del libro e del documento e della scienza dell’informazione almeno dalla seconda metà del XIX secolo, grazie alle intuizioni di Melvil Dewey e Henry Bliss, ma con radici assai antiche (basti pensare all’organizzazione aristostelica dello scibile umano)3.
Potremmo, quindi, dire che la gestione della mole di dati che caratterizza ormai la nostra vita quotidiana in rete4 e che conduce al sovraccarico informatico e a vere e proprie patologie da esso derivanti5 rappresenti una delle sfide maggiori del nostro ambito scientifico. Al momento attuale riuscire a rendere fruibile, disseminabile e riusabile il valore informativo che deriva dalle enormi quantità di materiale disponibile nella rete, selezionando in modo rapido e efficiente i risultati delle ricerche che corrispondono ai desiderata, è ancora un processo lungo e costoso. Senza addentrarci nel complesso tema dei big data, la cui lettura, gestione e analisi sono strategiche non soltanto per la realtà aziendale, ma anche per la ricerca e il benessere sociale – un esempio su tutti, il ruolo di tali tecniche durante l’emergenza da Covid-19 – basti ricordare come la preoccupazione per quantità troppo grandi di informazioni da recepire e gestire accompagni da molti secoli la nostra civiltà e non sia una caratteristica solo dei tempi moderni6. Nonostante, dunque, non si tratti di un fenomeno dovuto all’uso della tecnologia e del digitale, inevitabilmente lo ‘spostamento’ dei dati nel web ne ha comportato, da un lato, un’accelerazione e, dall’altro, l’ideazione di ipotesi per contrastarlo diverse da quelle avanzate in passato. Numerose espressioni sono state coniate per cercare di cogliere questo tratto dei nostri tempi, tra le quali information overabundance, infoglut, infobesity, communication overload, information pollution, data smog, information fatigue, social media overload, library anxiety, infostress, reading overload, cognitive overload, information violence ecc.
Nella ricostruzione di Floridi la civiltà umana ha vissuto, dapprima, nella fase preistorica (l’epoca in cui le informazioni non erano registrate), passando poi alla storia e, successivamente, all’iper-storia e alla condizione di 'on-life'7; il termine, ideato oltre un decennio fa per un progetto europeo dal titolo Onlife initiative: concept reengineering for rethinking societal concerns in the digital transition e della cui fortuna l’autore stesso si è dichiarato sorpreso8, indica la commistione tra processi meccanici e automatici che caratterizzerà sempre più la società digitale del futuro, ibrida, nella quale sarà impossibile distinguere la vita offline dalle esperienza online, separare analogico e digitale, umano e macchina.
Proprio la dimensione dell''infosfera', espressione presente da almeno mezzo secolo nella letteratura scientifica di vari settori disciplinari, esprime efficacemente la coesistenza di informazione online e offline in un unico spazio, le cui dimensioni sono in costante aumento e per vivere nel quale è importante «avere un senso della nostra autonomia che non è quella delle macchine, della nostra intelligenza che non è quella delle macchine, della nostra responsabilità che non possiamo dare alle macchine»9 (per inciso, si arriva a parlare di una vera e propria ‘guerra dell’informazione’, information warfare, quando entra in gioco la sicurezza dei dati governativi, politici e finanziari10).
Ed è in questo contesto che vorrei collocare i due contributi oggetto di riflessione.
A inizio dicembre 2020 Meschini ha discusso del suo lavoro all’interno del ciclo di seminari di cultura digitale che si tengono nel Corso di laurea magistrale in informatica umanistica dell’Università di Pisa11; a causa della fase emergenziale l’incontro si è svolto da remoto sulla piattaforma Teams e ha visto la partecipazione di un pubblico nutrito di studenti e studiosi12.
Già la scelta del titolo, Oltre il libro, evidenzia una relazione tra il libro e il web incentrata sul primo come asse portante; il libro come «script act», atto di scrittura, che lascia tracce dietro di sé e si lega ai vari materiali che costituiscono il paratesto, come sostiene l’autore nel seminario appena ricordato.
Il volume è articolato in cinque capitoli, preceduti da una prefazione e un’introduzione e seguiti dalla nutrita bibliografia.
Nel primo capitolo, Il libro e il web. La rete come ambiente informativo, viene chiarito l’ambito in cui si colloca il lavoro. Meschini richiama, innanzitutto, due opere – Contro il colonialismo digitale: istruzioni per continuare a leggere di Roberto Casati (Laterza, 2013) e L’età della frammentazione: cultura del libro e scuola digitale di Gino Roncaglia (Laterza, 2018) – che, pur con un diverso approccio, fanno propria la visione della centralità delle scuole e, in particolare, delle biblioteche. Anche la struttura non lineare, organizzata su più ‘livelli’ in base ai concetti di frammento e complessità, contribuisce ad accomunare i due lavori motivando, inoltre, la scelta della forma ‘libro cartaceo’ come tramite per contenuti digitali. Secondo l’autore, infatti, un libro tipografico va ritenuto «una particolare tipologia all’interno dell’ecosistema digitale»13, dal momento che tutte le fasi di creazione del libro, dalla ricerca delle fonti alla stesura, sono basate su mezzi digitali.

Testo digitale e testo tipografico sono giocatori della stessa squadra in una partita più ampia che si svolge su più fronti. Come in ogni gioco di squadra devono però differenziarsi e specializzarsi nei rispettivi ruoli, seguendo quelle che sono le loro inclinazioni naturali. Quindi un testo digitale sarà tanto più efficace quanto più si differenzierà da quello tipografico e viceversa14.

Alle fondamenta di ogni attività sui testi e con i testi deve essere posta la capacità di selezionare e miscelare i contenuti, la frammentazione e la complessità già citate. Viene quindi presentato Hypothesis, uno strumento di annotazione per testi sul web; segue una sintesi del percorso del web, a partire dai primi protocolli di rete, come il Gopher, sino ad arrivare al ‘prodotto’ attuale costruito, pur solo in parte, con la tecnica dei dati aperti e collegati (linked open data).
Nei successivi tre capitoli del volume – La tecnologia del testo. L’edizione critica tra libri elettronici, archivi e biblioteche digitali; Tipografia computazionale. Pubblicare un’edizione critica digitale; Dal documento all’ontologia. L’edizione elettronica del nachlaß di Ludwig Wittgenstein – il lettore viene condotto nel complesso mondo delle edizioni critiche digitali. La centralità attribuita dall’informatica umanistica alle operazioni di codifica testuale, ossia la rappresentazione informatica di un testo per mezzo di linguaggi di marcatura descrittivi, spiega lo spazio riservato da Meschini all’analisi di edizioni elettroniche, messe in opportuno collegamento con le biblioteche digitali. L’autore si sofferma, in particolare, su alcuni concetti cardine, di difficile e incerta definizione: cosa sia un’edizione critica, quale siano le sue finalità e quali funzionalità abbia rispetto all’edizione a stampa; cosa si intenda con ‘edizione elettronica’ tenendo conto della «multidimensionalità di questo strano animale […] che sembra sfuggire continuamente a una qualsiasi classificazione tassonomica»15; come la tecnologia, che possiede una propria autonomia e carattere intellettuale, influenzi l’oggetto ‘edizione critica’.
Il caso dell’edizione critica digitale dell’ingente materiale manoscritto di Ludwig Wittgenstein offre lo spunto per fornire un quadro dettagliato di un progetto di grande spessore evidenziandone le varie fasi, i risultati ottenuti e gli strumenti usati, in primis le ontologie computazionali.
Con l’ultimo capitolo, dal titolo Digital scholarship. Nuove forme e modelli della comunicazione scientifica, si entra nell’ambito della comunicazione scientifica, dei metodi di ricerca e disseminazione dei risultati basati sul digitale e, di conseguenza, potenziati.
Benché la struttura della materia e l’angolazione con cui tali argomenti vengono affrontati differisca nei due autori, molte tra le tematiche presenti nel volume di Meschini caratterizzano un altro recente lavoro monografico, Organizzare la conoscenza: digital humanities e web semantico: un percorso tra archivi, biblioteche e musei di Francesca Tomasi; proprio questa diversità in studiosi appartenenti al medesimo settore disciplinare testimonia l’ampio spazio di azione esistente all’interno della ‘grande tenda’ delle digital humanities (DH).
Articolato in un’introduzione, sei capitoli e una ricca bibliografia, il libro di Tomasi è orientato al «processo di produzione, conservazione, manipolazione e disseminazione dei dati culturali» e intende mostrare al lettore come dalla meta-disciplina delle DH possa scaturire «una nuova metodologia trasversale di analisi della conoscenza»16.
Il primo capitolo, La humanities computing incontra il web (semantico), ripercorre la storia della nascita dell’informatica umanistica in Italia, in parallelo al percorso delle humanities computing (HC), definitesi poi digital humanities, in ambito europeo e statunitense. Utile la precisazione in negativo: le DH non si esauriscono nell’utilizzo di risorse digitali né nelle operazioni di digitalizzazione, non consiste nel saper usare il computer, né nel realizzare siti web o attività di inserimento dati. L’autrice ricorda come il web semantico unisca due prospettive diverse e complementari delle digital humanities, quella digitale (DH) e quella computazionale (HC), «in una nuova visione dell’interazione uomo-macchina in cui è l’organizzazione della conoscenza il filo conduttore»17. La trasformazione del web è stata un’evoluzione determinante nei «sistemi di rappresentazione digitale del contenuto trasmesso dalle risorse informative»18 con inevitabili ripercussioni nelle istituzioni della memoria e nel mondo della ricerca. Il web semantico innova, infatti, la struttura dei dati attraverso i dati aperti e collegati «capaci di garantire la FAIRness (ovvero la Findability, Accessibility, Interoperability, Reuse) di dati ricchi e semanticamente espressivi»19.
Nel secondo capitolo, Descrizione o interpretazione? Il ruolo delle DH nella sfida ermeneutica, si riflette sulle ‘somiglianze’ tra la library and information science e le DH20; la descrizione di oggetti culturali accomuna i due ambiti e da essa deriva una narrazione alla base dei dati. Di conseguenza, Tomasi sottolinea come non siano i dati a doversi ‘piegare’ alle indicazioni presenti negli standard descrittivi, bensì il contrario: occorre riformulare le norme tenendo conto della loro funzione di agevolare gli studiosi nella ricerca.
Dopo aver ricordato i principali standard e i modelli concettuali usati nei tre ambiti delle istituzioni culturali (archivi, biblioteche, musei), l’autrice afferma che queste ultime devono assumere nuovamente il «ruolo di mediatori del sapere», oggi insediato da soggetti commerciali, valorizzando «la descrizione degli oggetti culturali attraverso la lente dell’interpretazione»21 e sfruttando l’arricchimento dei dati derivante dalla collaborazione reciproca.
I due capitoli successivi – Contesti. Ovvero la lezione degli archivi e Ragionare a livelli oltre l’universo bibliografico – sono inquadrati, rispettivamente, nella sfera delle discipline archivistiche e biblioteconomiche.
Si parte dal ‘contesto’, ciò che permette al dato di diventare informazione, il fattore da cui dipende la variabilità a livello di significato e in grado di valorizzare le possibili relazioni.
La sua importanza risulta chiaramente prendendo come riferimento l’archivistica e i tre ‘fronti’ della definizione del soggetto produttore/creator, della conformità al principio di provenienza/provenance e del posizionamento dell’entità nella gerarchia documentaria. La modellazione dei dati a grafo, mediante una struttura fatta di nodi (per la gestione delle entità) e di archi (per esprimere le relazioni tra entità), è quella che meglio raffigura il contesto, come testimoniato dal recente modello Records in contexts, giunto alla versione di luglio 2021 (Records in contexts conceptual model, version 0.2, RiC-CM 0.2)22.
Passando alle biblioteche viene analizzato il modello Functional requirements for bibliographic records (FRBR), nato oltre due decenni fa in ambito bibliografico ma usato anche al di fuori di esso, come nel progetto FRBR all’Opera focalizzato sulla storia del melodramma italiano. Con FRBR object oriented (FRBRoo), approvato nel 2009, si cerca l’armonizzazione dei modelli concettuali di pertinenza bibliografica e quelli del settore museale per favorire l’interoperabilità dei dati tra questi domini. La pubblicazione di IFLA Library reference model (IFLA LRM) nel 2017 segna, infine, l’unificazione dei vari modelli della ‘famiglia’ FR23.
Nel quinto capitolo, intitolato Organizzare la conoscenza con i LOD, Tomasi si sofferma sui linked open data che costituiscono e consentono una nuova modalità di organizzare «le informazioni descrittive di oggetti, o meglio di things, di cose del mondo reale, nella forma di entità€»24. I dati aperti e collegati sono orientati al potenziamento dei dati delle istituzioni culturali mediante la creazione di una rete di rimandi reciproci nell’ottica MAB (musei, archivi, biblioteche) o GLAM (galleries, libraries, archives and museums). Si accenna alle visualizzazioni sinora realizzate per i LOD; la visualizzazione è intesa anche come mezzo di analisi e può confluire nella realizzazione di percorsi e storie mediante i dati aperti e collegati (storytelling).
Il volume si chiude con il capitolo Progettare risorse digitali nel cultural heritage dedicato alla descrizione analitica delle diverse fasi in cui si articola un progetto nelle digital humanities; vengono proposte alcune buone pratiche nella pianificazione di un progetto e prospettati, infine, «profili di esperto in DH, che, con gli strumenti del Web semantico, sappia far fronte a problemi di organizzazione della conoscenza, in particolare nel contesto di archivi, biblioteche e musei»25.
Se, dunque, l’ottica con cui l’ampio terreno delle digital humanities viene esaminato differisce nei due lavori, che possiamo considerare anche per questo motivo complementari, esiste alla base una visione comune, un trait d’union, tra i due studiosi ravvisabile nella centralità attribuita alle operazioni di rappresentazione, organizzazione e, infine, trasmissione della conoscenza.
Nella fase attuale caratterizzata, come già evidenziato in apertura, dalla crescente mole di dati che popolano sia la dimensione analogica sia quella sul web – in un solo termine, l’'onlife' – queste funzioni stanno acquistando sempre maggiore rilevanza non soltanto per gli studiosi, ma anche per una platea più ampia, addirittura l’intera società potenzialmente interessata alla fruizione delle informazioni relative ai beni culturali, come primo passo per poi accedere ai beni stessi. Oltre che conservare documenti di vario tipo, archivi e biblioteche creano e gestiscono da secoli grandi quantità di notizie relative ad essi (metadati), disponendoli secondo criteri che ne assicurino la reperibilità all’interno di sistemi di ricerca dapprima su supporto analogico e poi digitale. Il web ha ampliato il bacino dal quale è possibile attingere informazioni, comportando un’esposizione al ‘caos’ che inevitabilmente caratterizza ambienti dai confini sfumati, forse addirittura inesistenti; districare le nebbie dell’information pollution e agevolare la sicura identificazione delle informazioni sul patrimonio librario e documentale per poi consentirne l’accesso è una sfida che attende gli umanisti digitali che operano nelle e per le istituzioni della memoria.


Note

Ultima consultazione siti web: 15 novembre 2022.

1 I due volumi al centro del contributo sono: Federico Meschini, Oltre il libro: forme di testualità e digital humanities. Milano: Editrice bibliografica, 2020 e Francesca Tomasi, Organizzare la conoscenza: digital humanities e web semantico: un percorso tra archivi, biblioteche e musei. Milano: Editrice bibliografica, 2022.
2 La quarta, dopo il passaggio da oralità a scrittura, da rotolo a libro paginato, da manoscritto a libro a stampa, cfr. Gino Roncaglia, La quarta rivoluzione: sei lezioni sul futuro del libro. Roma: Laterza, 2010.
3 Un’utile panoramica sul tema si deve a Claudio Gnoli; Vittorio Marino; Luca Rosati, Organizzare la conoscenza: dalle biblioteche all’architettura dell’informazione per il web. Milano: Hops Tecniche nuove, 2006.
4 Per avere uno sguardo d’insieme aggiornato sulla consistenza del digitale si vedano i rapporti di DataReportal prodotti in collaborazione con vari partner, tra i quali le aziende Hootsuite e We Are Social, https://datareportal.com/.
5 Nel 1990 lo psicologo britannico David Lewis, autore del rapporto Dying for information? commissionato da Reuters Business Information, ha coniato il termine 'information fatigue syndrome' (IFS) per indicare una patologia che può colpire i knowledge worker. Sul tema dell’information overload e dell’information overload addiction è disponibile una copiosa letteratura scientifica, testimoniata dall’oltre un milione e seicentomila risultati ottenuti lanciando una ricerca in Google scholar con il termine in inglese e i quasi ottomila risultati utilizzando l’espressione italiana ‘sovraccarico informativo’).
6 Per un approfondimento, si veda David Bawden; Lyn Robinson, Information overload: an overview. In: Oxford encyclopedia of political decision making, David P. Redlawsk editor in chief. Oxford: Oxford University Press, 2020, DOI: 10.1093/acrefore/9780190228637.013.1360.
7 Luciano Floridi, La quarta rivoluzione: come l’infosfera sta trasformando il mondo. Milano: Cortina, 2017.
8 Cfr. Edoardo Bianchi, OnLife, intervista a Luciano Floridi: "La società digitale sarà sempre più ibrida". 6 ottobre 2019, La repubblica.it, [video online], https://www.youtube.com/watch?v=vrsUbYUYp2M. Si veda la definizione del termine nel Vocabolario Treccani, Neologismi, 2019, https://www.treccani.it/vocabolario/onlife_(Neologismi).
9 E. Bianchi, OnLife, intervista a Luciano Floridi
10 Si veda, tra gli altri, Dorothy E. Denning, Information warfare and security. Reading (MA): Addison-Wesley, 1999.
11 I seminari, aperti a tutti gli interessati e registrati, sono coordinati da Enrica Salvatori e Maria Simi, cfr. http://www.labcd.unipi.it/seminario/.
12 È disponibile la registrazione dell’incontro, suddivisa in due parti, cfr. http://www.labcd.unipi.it/seminari/seminario-di-cultura-digitale-federico-meschini-oltre-il-libro-parte-1/ e http://www.labcd.unipi.it/seminari/seminario-di-cultura-digitale-meschini-oltre-il-libro-parte-2/.
13 F. Meschini, Oltre il libro cit., p. 46.
14 Federico Meschini intervistato su Letture.org, https://www.letture.org/oltre-il-libro-forme-di-testualita-e-digital-humanities-federico-meschini.
15 F. Meschini, Oltre il libro cit., p. 107.
16 F. Tomasi, Organizzare la conoscenza cit., p. 11.
17 Ivi, p. 18-19.
18 Ivi, p. 32.
19 Francesca Tomasi intervistata su Letture.org, https://www.letture.org/organizzare-la-conoscenza-digital-humanities-e-web-semantico-francesca-tomasi.
20 Sul tema si rimanda, tra gli altri, a Simona Turbanti, “Se alzi un muro, pensa a ciò che resta fuori!”: le discipline del libro e del documento e la cultura digitale in Italia. In: Letteratura e scienze: atti delle sessioni parallele del XXIII Congresso dell’ADI (Associazione degli Italianisti) Pisa, 12-14 settembre 2019, a cura di Alberto Casadei, Francesca Fedi, Annalisa Nacinovich, Andrea Torre. Pisa: ADI, 2021, https://www.italianisti.it/pubblicazioni/atti-di-congresso/letteratura-e-scienze/5.ADI_19_TURBANTI.pdf e Simona Turbanti, La “tenda” delle digital humanities come spazio di sviluppo per le biblioteche. In: Convegno delle Stelline 2021: La biblioteca piattaforma della conoscenza: collaborativa, inclusiva, reticolare. Milano: Associazione Biblioteche oggi, Editrice bibliografica, 2021, p. 361-366.
21 F. Tomasi, Organizzare la conoscenza cit., p. 73.
22 Expert Group on Archival Description, Records in contexts - conceptual model, https://www.ica.org/en/records-in-contexts-conceptual-model.
23 Molti sarebbero gli spunti critici sull’applicabilità di tutti i modelli citati al materiale delle istituzioni culturali, in particolare le biblioteche, e sulla ricaduta, in termini di ricercabilità, negli strumenti attualmente a disposizione degli utenti (i cataloghi), ma il tema richiederebbe un approfondimento non opportuno in questa sede; si rimanda ad Alberto Petrucciani; Simona Turbanti, Manuale di catalogazione: principi, casi e problemi. Milano: Editrice bibliografica, Roma: Associazione italiana biblioteche, 2021, p. 49-54 e Alberto Petrucciani, I modelli bibliografici (da FRBR a LRM): un edificio da ricostruire dalle fondamenta? In: Bibliografie e cultura: studi per Alfredo Serrai, a cura di Enrico Pio Ardolino e Diego Baldi. Roma: CNR, Istituto di scienze del patrimonio culturale, 2022, p. 155-173.
24 Francesca Tomasi intervistata su Letture.org, https://www.letture.org/organizzare-la-conoscenza-digital-humanities-e-web-semantico-francesca-tomasi.
25 F. Tomasi, Organizzare la conoscenza cit., p. 163.