WebDewey search

di Piero Cavaleri

Introduzione

L'evoluzione del mondo attorno alle biblioteche e delle necessità che sorgono all'interno delle biblioteche stesse, sta rendendo ormai da tempo indispensabile che si riescano ad utilizzare, a vantaggio dell'utente finale, tutte le informazioni create dalle biblioteche con gli strumenti di indicizzazione. Nel caso della Classificazione decimale Dewey (DDC) la possibilità per gli utenti finali di condurre qualche tipo di ricerca sul ricco bagaglio lessicale che accompagna i numeri di indicizzazione, di navigare da un numero all'altro attraversando la gerarchia e le altre strutture relazionali1 della classificazione in modo facilmente comprensibile e senza necessità di conoscenze specifiche, è sicuramente di grande interesse per tutte le biblioteche che la impiegano, qualunque sia la versione o edizione usata.
I costi che il sistema delle biblioteche sopporta per produrre un sistema classificatorio così sofisticato e ricco come la DDC e quelli che le singole biblioteche devono affrontare per indicizzare i documenti, impongono che tutti gli elementi di questa struttura che possano essere di qualche utilità per risolvere i problemi informativi degli utenti vengano resi disponibili nella maniera più semplice e intuitiva agli stessi.
Gli elementi della classificazione in questione sono: le vedette che accompagnano ogni numero, le voci dell'indice relativo, le vedette delle notazioni delle tavole ausiliarie, oltre naturalmente alle relazioni gerarchiche che tengono insieme numeri e intervalli. Rilevanti per queste funzioni risultano anche le note di rimando che accompagnano molti numeri.
La disponibilità dell'intera DDC all'interno di un database elettronico ha consentito di realizzare uno strumento, riservato agli operatori, ricco di funzionalità di ricerca come la WebDewey2. Molte di queste funzionalità, se ripensate in modo da renderle ancor più semplici nell'utilizzo, si potrebbero rivelare molto utili anche per gli utenti finali.
La WebDewey è quindi la prova evidente che sia possibile realizzare, ormai con relativa facilità visto che il lavoro di creazione del database è stato fatto, strumenti in grado di offrire funzioni di ricerca semantica per gli utenti, strumenti che sfruttino a pieno le potenzialità implicite nella DDC, che però non potevano essere sfruttate nell'edizione cartacea per il costo di ogni copia, per la complessità dell'utilizzo e per l'assenza di una relazione immediata tra l'individuazione di una notazione e le opere eventualmente con essa indicizzate.
Oggi la WebDewey consente ai tutti bibliotecari, compresi coloro che non sono classificatori a tempo pieno, di svolgere molte ricerche semantiche e di navigare lungo la gerarchia della DDC senza più dover passare attraverso un'approfondita conoscenza dei significati delle notazioni, perciò non si vede perché analoga possibilità non debba essere messa a disposizione anche degli utenti attuali e potenziali delle biblioteche stesse.

Il progetto WebDewey search

Cinque anni fa, nel 2012, tre biblioteche nazionali, quelle di Germania, Norvegia e Svezia3 hanno deciso di avviare un progetto teso a consentire agli utenti di svolgere ricerche semantiche attraverso la DDC4. A tal fine hanno incaricato la società tedesca Pansoft, che mantiene il software per la traduzione della DDC dall'inglese e la pubblicazione della WebDewey nelle lingue italiana, tedesca, svedese e norvegese, di sviluppare un programma per la ricerca da parte degli utenti finali all'interno della DDC.
Il progetto aveva lo scopo specifico di mettere a disposizione di ognuna delle biblioteche nazionali un'implementazione del software che potesse accogliere i dati delle versioni della DDC nelle lingue nazionali, con il fine di consentire agli utenti finali di compiere operazioni di navigazione e ricerca per parole e, conseguentemente, di individuare direttamente, in uno o più OPAC collegati, i documenti indicizzati con le notazioni DDC scelte.
Nell'"IFLA world library and information congress 2016", Aagaart, Conradi, Mengel5 hanno offerto un'estesa comunicazione per presentare le realizzazioni derivate dal progetto, relazione da cui questo breve articolo in gran parte prende spunto.
Il risultato del progetto è stato la creazione di tre prodotti:

Le tre realizzazioni

In ognuna delle realizzazioni gli utenti possono compiere ricerche sui dati provenienti dalla DDC in base a due modalità: navigazione lungo gli alberi gerarchici delle dieci classi della DDC e ricerca per parole chiave all'interno dell'indice relativo della DDC.


Figura 1 - Schermata iniziale della WebDewey search della Biblioteca nazionale tedesca


Figura 2 - Schermata iniziale della WebDewey search della Biblioteca nazionale norvegese


Figura 3 - Schermata iniziale della WebDewey search della Biblioteca nazionale svedese

Le pagine iniziali delle tre versioni della WebDewey search offrono agli utenti finali le dieci classi principali della DDC, rappresentate sia dalle notazioni che dalle rispettive vedette. Entrambi questi elementi sono dei link ipertestuali che conducono alle rispettive sottoclassi. Ad ogni livello della navigazione vengono mostrate sia le classi della DDC che i numeri costruiti esistenti nei database nazionali.
Di fianco ad ogni notazione di classe il software, nella versione tedesca e svedese, presenta due colonne: nella prima colonna ci sono il/i numero/i dei documenti presenti in ognuno dei cataloghi collegati, identificati con una sigla, sulla base della ricerca per l'esatta notazione; nella seconda colonna invece ci sono i numeri corrispondenti ai risultati di ricerche condotte negli stessi cataloghi, anche questa volta identificati tramite sigle, sia per l'esatta notazione sia per tutte le sue sottoclassi. Nella versione norvegese c'è solo una colonna perché la ricerca con l'esatta notazione non è stata ritenuta utile.
Cliccando sia sulle vedette che sulle notazioni si può aprire il livello successivo della classificazione, con l'indicazione anche in questo caso del numero dei libri disponibili nei vari cataloghi collegati. Attraverso questo meccanismo l'utente rimane costantemente informato sia sull'articolazione di una classe, che sugli argomenti coperti dalle notazioni, grazie alle espressioni verbali delle vedette e alla quantità di documenti che potenzialmente sono disponibili nelle biblioteche afferenti ai singoli cataloghi. Quest'ultima informazione è molto rilevante per quanto riguarda la decisione di continuare o meno ad approfondire la navigazione nella gerarchia.
L'utente è messo in grado di comprendere, già direttamente dall'interno del sistema della WebDewey search, la quantità della documentazione che si troverebbe di fronte dopo aver cliccato in una delle due colonne sulla sigla relativa a ciascun catalogo, accedendo in questo modo allo stesso.
Nella navigazione sulle classi vengono mostrate anche le note di rimando ad altre classi. Per esempio, visualizzando (Figura 4) come classe focale 330 Wirtschaft (Economia) vengono visualizzate anche le due note di rimando (note vedi):


Figura 4 - Schermata con classi e note di rimando (WebDewey search tedesca)

Le due vedette, Gestione generale e Diritti di proprietà, corrispondenti alle notazioni 658 e 323.46, sono dei collegamenti che consentono di navigare alle rispettive gerarchie.
In WebDewey search, oltre alla navigazione sulle classi, è possibile compiere delle ricerche per parole, anche con possibilità di troncamento a destra. Questa funzione agisce sui termini dell'indice relativo della DDC. L'indice relativo DDC è un elenco degli argomenti che sono coperti da una classe della DDC. La struttura delle voci dell'indice relativo prevede un concetto principale e una serie di sottotermini che precisano il termine principale oppure il contesto disciplinare, aspetti geografici o cronologici delle opere indicizzate con un numero specifico in cui l'argomento ricorre. Cliccando sulla voce dell'indice relativo si accede alla classe cui quella voce è collegata. Questa classe viene presentata con la gerarchia sovrastante e le suddivisioni immediatamente sottostanti. Anche in questo caso, accanto ad ogni notazione è presentata la relativa vedetta e le due colonne con i numeri dei libri presenti nei cataloghi collegati. I numeri, anche in questo contesto, fungono da collegamenti per l'accesso ai cataloghi in questione.
Una caratteristica peculiare della versione tedesca è la possibilità di visualizzare, navigando sulle tavole comuni, il numero dei documenti presenti in due dei cataloghi indicizzati con notazioni che contengono come parti utilizzate per la sintesi ognuna delle notazioni di queste sei tavole. Questo è possibile perché all'interno di questi cataloghi, quello della Biblioteca nazionale tedesca e quello collettivo del Baden-Wurttemberg, i record dei numeri costruiti registrano anche le singole parti componenti.
Il vantaggio che offre questa possibilità è, usando le parole delle autrici della relazione a "IFLA WLIC 2016":

the access to titles that have been assigned a built number that is not part of the standard edition repertory held in WebDewey Deutsch. For example, 914.9235204 (travel in Amsterdam) is not included in WebDewey Deutsch, but access to titles classified by the number is provided by browsing to T2-492352 Amsterdam10.

La presenza dell'informazione sulle parti componenti dei numeri costruiti consente nella versione tedesca di proporre anche nelle tavole principali l'informazione sul numero di opere indicizzate con numeri costruiti in cui queste notazioni siano state utilizzate come parte di nell'operazione di sintesi, naturalmente quando sia consentita la sintesi da qualsiasi parte delle tavole principali o da una parte di esse. Questa informazione è data nella quinta colonna delle schermate di navigazione sulle tavole principali (Figura 1).
La Biblioteca nazionale norvegese offre un'application programming interface (API) per consentire ai produttori di cataloghi non commerciali di recuperare direttamente dall'interno delle loro realizzazioni gli stessi dati utilizzati nella WebDewey search. Il fine è di integrare la ricerca e la navigazione DDC e delle risorse con essa indicizzate direttamente negli OPAC. Fino ad oggi, due produttori di software per biblioteche hanno deciso di usufruire di questa possibilità. In questa stessa versione è presente la tecnica di navigazione a "briciole di pane", che si ritiene possa facilitare l'utente nella navigazione nella gerarchia.
Un'altra particolarità della versione norvegese è l'implementazione dell'indice relativo bilingue: norvegese e inglese. Ogni voce viene presentata nella versione norvegese con a fianco quella inglese, con la possibilità di ricerca su entrambe.
La versione svedese offre il collegamento a Libris, il catalogo collettivo delle biblioteche universitarie e di ricerca che contiene circa 4.000.000 opere indicizzate con la DDC e con la classificazione Swedish subject headings (SAB). Per poter accedere con le ricerche anche alle opere indicizzate con SAB, è stata realizzata una mappatura tra le notazioni di questa e quelle della DDC. La maggior difficoltà nell'utilizzo di questa versione si ha nelle ricerche per parole, perché solo il 40% della classificazione è già tradotta in svedese, così che gli utenti possono non trovare tutte le classi legate ad una sola parola, finire su classi con intestazione in inglese anche quando la ricerca è avvenuta in svedese oppure ottenere risultati spuri quando parole con la medesima grafia nelle due lingue hanno significati diversi.

Aspetti critici

Chi ha realizzato il sistema lascia aperte due importanti questioni relativamente alle implicazioni della proposta agli utenti finali di ricerche basate sulle voci dell'indice relativo, pensato per un pubblico professionale cui sono note le motivazioni per le inclusioni e la strutturazione dello stesso.
La prima questione riguarda quali e quanti rapporti di equivalenza tra i termini dell'indice sono registrati nei singoli database nazionali della DDC e come renderli evidenti.
Le circa 105.000 voci dell'indice in inglese11, che nel caso della WebDewey italiana diventano più di 110.000 per l'aggiunta di molte voci geografiche, comprendono infatti anche molti sinonimi. L'indicazione di sinonimia è stata registrata solo in un numero di casi limitato poiché solo da poco la redazione ha cominciato a far ciò in modo sistematico, mentre precedentemente veniva fatto solo per i casi ritenuti più utili e/o problematici. Quest'ultima scelta era indispensabile quando l'indice era a stampa, visto che limitarne la lunghezza era una necessità, mentre d'altro canto era più utile dare immediatamente a fianco di ognuno dei sinonimi la notazione corrispondente piuttosto che costringere il catalogatore a cercare nell'indice un'altra voce per trovare questa informazione. Peraltro non in tutte le occorrenze di un concetto vengono date tutte le possibili rappresentazioni lessicali. Questa mancanza di sistematicità può essere fonte di difficoltà per chi svolga ricerche per parole.
Il secondo problema riguarda quali siano le specifiche relazioni semantiche che legano le singole voci dell'indice relativo con una specifica notazione. Infatti, l'assegnazione ad una classe di una voce di indice indica che chi sviluppa la DDC ritiene che l'argomento rappresentato da quella voce sia in qualche modo trattato nelle opere indicizzate con quel numero, ma la ragione di questa valutazione non viene mai esplicitamente indicata. Si sa che c'è una relazione, ma non quale sia l'esatta natura della stessa. In particolare quando un utente trova una voce dell'indice relativo con a fianco una notazione, non ha alcuna idea se la voce stessa abbia un'estensione coincidente con quella della notazione o semplicemente si riferisca a un sottoinsieme, spesso molto più piccolo dell'insieme complessivo, delle opere indicizzate con quel numero.
Facendo un esempio, dopo una ricerca sull'indice relativo con la parola Oro (nella Figura 5, ricerca per Gold in tedesco), non è possibile sapere se la relazione tra la voce Oro e la classe 669.22 cui è collegata sia di equivalenza estensionale, oppure se Oro indichi solo uno di tanti argomenti che possono essere trattati nei libri indicizzati con quel numero, come succede nella WebDewey italiana nel caso della voce Movimenti di oro, che risulta collegata alla notazione 332.0424 ma certamente non riguarda tutte le opere indicizzate con questo numero, visto che vi sono altre cinque voci dell'indice relativo ad esso collegate.


Figura 5 - Schema dei risultati di una ricerca (WebDewey search tedesca)

Conclusioni

L'AIB sta studiando la possibilità di realizzare una versione italiana della WebDewey search che consenta anche alle biblioteche italiane di sfruttare, a vantaggio dei loro utenti e dei cittadini tutti, il grande lavoro svolto negli ultimi 30 anni per tradurre l'intera DDC e anche lo sforzo per l'indicizzazione con la DDC che vede protagoniste le biblioteche italiane da ormai svariati decenni.
Lo strumento creato dalle tre biblioteche nazionali di Germania, Svezia e Norvegia presenta particolarità che nelle tre versioni derivano dal diverso grado di completezza della traduzione, dalla diversa modalità di archiviare le informazioni sui numeri costruiti e dall'estensione dell'applicazione della DDC nei cataloghi di riferimento.
In particolare, i problemi derivanti dall'incompletezza delle traduzioni, che emergono nelle versioni norvegese e svedese, non dovrebbero coinvolgere un'eventuale versione italiana, visto che la WebDewey italiana è tradotta nella sua interezza e in questo può essere paragonata alla versione originale in inglese e a quella in tedesco.
In comune con la versione norvegese, la WebDewey italiana ha la possibilità per i bibliotecari di utilizzare il costruttore di numeri e quindi di segnalare alla redazione quelli che è utile aggiungere al database di base, possibilità che porta con sé la disponibilità di tutte le informazioni sulle parti componenti dei numeri costruiti segnalati. Questo potrebbe aiutare a realizzare funzioni di ricerca sulle tavole ausiliarie analoghe, anche se ottenute con modalità tecnicamente diverse, a quelle proposte dalla versione tedesca.
Anche la relativa scarsità di documenti indicizzati con la DDC negli OPAC, determinata nei tre paesi dalla adozione relativamente recente della DDC, non dovrebbe riguardare le biblioteche italiane, che vantano una lunga tradizione nel suo impiego.
La WebDewey italiana è una versione completamente e totalmente tradotta in italiano dell'originale in inglese, per cui non si presenteranno problemi di commistione di due lingue. Un altro vantaggio dell'eventuale versione italiana sarà la completezza dell'indice relativo sia rispetto alle voci composte da termini generici sia per quanto riguarda i termini geografici relativi all'Italia.
Ci saranno invece problemi ignoti ai colleghi stranieri:

Il primo problema richiede da parte dell'AIB la capacità di aggregare attorno al progetto soggetti in grado di apportare un sia pur modesto, ma necessario, contributo economico, in modo da riuscire a coprire l'investimento iniziale e il mantenimento del sistema. In questo senso, sarebbe bene che tutti coloro che sono interessati a che il proprio OPAC sia indicizzato da WebDewey search prendano contatto con l'AIB12, in modo che si possa valutare quanto interesse c'è ed elaborare ipotesi di costi sulla base di scenari realistici.
Il secondo aspetto potrebbe portare a soluzioni molto diverse. Si può ipotizzare il collegamento ad un unico catalogo, per esempio SBN, oppure, sul versante opposto, la realizzazione di diverse versioni della WebDewey search che aggreghino cataloghi omogenei per tipologia, area geografica, ruolo ecc.
La disomogeneità delle notazioni presenti nei singoli cataloghi, per quanto riguarda le edizioni della DDC impiegate, obbligherà le biblioteche che vogliano aderire alla proposta AIB a valutare quanto sono disposte ad accettare che le informazioni fornite ai propri utenti siano poco accurate, oppure ad investire per aggiornare i cataloghi. Infatti la WebDewey search propone esclusivamente notazioni tratte dalla WebDewey per come si presentano in un dato momento, per cui il collegamento con i cataloghi avviene solo per le notazioni ora esistenti e sulla base del significato che in questo momento hanno. Nel caso un catalogo abbia al suo interno opere indicizzate con notazioni non più utilizzate, queste non potranno essere trovate attraverso la WebDewey search. Invece se un catalogo contiene notazioni esistenti assegnate però ad opere che attualmente ne riceverebbero di diverse, la ricerca attraverso la WebDewey search farebbe in modo che queste opere siano proposte all'utente anche in scelte basate su vedette o voci dell'indice che poco potrebbero aver a che fare con quelle opere.
Riguardo il problema del collegamento con OPAC che recano principalmente notazioni dalle versioni ridotte, le considerazioni si presentano in parte come quelle fatte riguardo il punto precedente, con in più la difficoltà di dover far comprendere agli utenti che, anche a fronte a ricerche che evidenziano l'assenza di opere, in un OPAC di questo tipo è probabile che sia possibile salire di livello nella gerarchia per veder, eventualmente, soddisfatta la propria esigenza informativa. L'interesse per il collegamento efficiente all'eventuale WebDewey search italiana, che potrebbero avere coloro che gestiscono OPAC che adottano la DDC ridotta, potrebbe indurli a perseguire quanto abbiamo auspicato in un recente articolo: il passaggio all'indicizzazione con la WebDewey13.
Sicuramente le difficoltà per realizzare la WebDewey search italiana non saranno poche, ma i vantaggi che potrà apportare alle biblioteche e soprattutto agli utenti sono tali che giustificano ampiamente l'impegno delle persone e le risorse investite.

RIFERIMENTI BIBLIOGRAFICI

Ultima consultazione siti web: 19 aprile 2017.

[1] Rebecca Green, Relational aspects of subject authority control: the contributions of classificatory structure. In: Classification & authority control: expanding resource discovery. International UDC seminar 2015 (29-30 October 2015, Lisbon), http://www.udcds.com/seminar/2015/media/slides/Green_InternationalUDCSeminar2015.pdf.

[2] Per un'analisi delle caratteristiche della WebDewey, confrontate con le versioni online della Library of Congress Classification (LCC) e della Universal decimal classification (UDC) si veda Pranali B. Gedam; Ashwini Paradkar, A study of web-based library classification schemes, «International journal of library and information science», 5 (2013), n. 10, p. 386-393, http://www.academicjournals.org/journal/IJLIS/article-full-text-pdf/D12464E40107.

[3] Deutsche Nationalbibliothek, Nasjonalbiblioteket, Kungliga Biblioteket.

[4] La Biblioteca nazionale tedesca, dal 2006 al 2012, aveva già messo a disposizione degli utenti un sistema di ricerca sulla DDC chiamato Melvilsearch, parte del progetto Melvil: Deutsche Nationalbibliothek, Melvil - der deutsche Webservice zur Dewey-Dezimalklassifikation (DDC). 2016, http://www.ddc-deutsch.de/Subsites/ddcdeutsch/DE/DDCprodukte/Melvil/melvil_node.html#doc199440bodyText1.

[5] Harriet Aagaard; Elise Conradi; Tina Mengel, Leveraging the Dewey decimal classification for online subject access: three use cases of WebDewey search. In: "IFLA world library and information conference. IFLA WLIC 2016" (13-19 August 2016, Columbus, Ohio), https://docs.google.com/a/kent.edu/viewer?a=v&pid=sites&srcid=a2VudC5lZHV8aWZsYTIwMTYtY2xhc3NpZmljYXRpb24taW5kZXhpbmd8Z3g6Nzc3OTI4MDA5OTBiODUzOQ.

[6] http://deweysearchde.pansoft.de/.

[7] http://deweysearchno.pansoft.de/webdeweysearch/index.html.

[8] http://deweysearchsv.pansoft.de/. Per ognuna delle tre realizzazioni è possibile trovare sui siti delle singole biblioteche nazionali presentazioni nelle rispettive lingue. I testi delle presentazioni non sono stati analizzati dall'autore per mancanza di competenze linguistiche e perché si è ritenuto che la presentazione in inglese dei tre progetti da parte delle persone responsabili della loro realizzazione fosse sufficiente per poter dar conto degli stessi al pubblico italiano.

[9] Traduzione dell'autore.

[10] H. Aagaard; E. Conradi; T. Mengel, Leveraging the Dewey decimal classification for online subject access cit.

[11] Rebecca Green, Dewey by the numbers, «025.431: The Dewey blog», 1 marzo 2017, http://ddc.typepad.com/.

[12] Per manifestare il proprio interesse per il progetto WebDewey search italiana si può scrivere a segreteria@aib.it oppure all'autore di questo articolo a cavaleri.piero@gmail.com.

[13] Piero Cavaleri, Perché non ci sarà una nuova edizione ridotta della DDC in italiano e perché passare alla WebDewey, «AIB studi», 56 (2016), n. 3, p. 465-472, http://aibstudi.aib.it/article/view/11536.