Ancora su Google e la giungla digitale: altri misteri, novità e tendenze

La giungla del digitale riserva sempre nuove sorprese, movimenti che è bene conoscere e tendenze su cui riflettere. Spero perciò che possa essere utile segnalare ai lettori della rivista dell'Associazione alcuni fatti nuovi, o non considerati nel mio intervento pubblicato sul n.1/2 2011 del «Bollettino».

1. Come si defrauda il dominio pubblico

Il primo fenomeno a cui secondo me sarebbe utile dedicare maggiore attenzione è quello che va sotto il nome di copyfraud, ossia le manovre finalizzate a defraudare il pubblico della possibilità di utilizzare liberamente il materiale di dominio pubblico. Sulla copyfraud molti contributi, notizie e commenti si possono trovare in Internet (c'è anche una voce in Wikipedia, non ancora però nella versione italiana) e aggiungendo alla ricerca anche le parole Google Books si trovano facilmente informazioni e discussioni sul fenomeno che ci riguarda più da vicino.
Fra le varie forme ricollegabili alla copyfraud, infatti, c'è un fenomeno ormai dilagante in Google Books (ma segnalato almeno dal 2010), cioè la sostituzione di edizioni originali di libri e riviste fuori copyright con "edizioni" facsimilari recenti o recentissime, in commercio (almeno teoricamente) e quindi non più scaricabili liberamente dal pubblico. I casi sono innumerevoli: si possono vedere p.es. ricercando la «Revue des bibliothèques» e il «Zentralblatt für Bibliothekswesen».
Il fenomeno compare generalmente associato ad alcuni marchi editoriali, poco noti ma presenti con un numero altissimo di pubblicazioni, che riproducono edizioni fuori copyright e vengono vendute con sistemi di print-on-demand. Questi marchi editoriali sono diversi (Kessinger, BiblioLife, Nabu Press, BiblioBazaar, General Books, Books LLC e altri) ma, a quanto si ricava da qualche ricerca in Internet, sono in più casi collegati fra loro, come emanazione di una stessa azienda di software (BiblioLabs) e/o di una stessa persona fisica, con la stessa sede legale, ecc.
Il fenomeno è stato segnalato da parecchi utenti sul forum di discussione di Google Books. L'addetta di Google al forum, che si firma Sonia F., dopo aver menato un po' il can per l'aia, dichiarando che si sarebbe informata, ha risposto che in effetti erano stati riscontrati molti errori nel database dei metadati di Google Books, e che sarebbero stati corretti1.
Questo naturalmente non è avvenuto. Poi, nel marzo 2012, il forum è stato chiuso (e sostituito con un semplice servizio di assistenza per il nuovo megastore Google Play, di cui si parla più avanti).
Il mistero comprende qualche altro particolare intrigante, p.es. la notizia che un marchio della BiblioLabs, BookSurge, è stato acquisito anni fa da Amazon e il fatto che alcuni esemplari di "edizioni" col marchio BiblioBazaar, esaminate cortesemente per me da Giovanni Di Domenico, risultano stampati in Germania proprio da Amazon. Queste "edizioni" hanno anche, fra l'altro, la particolarità di dichiarare un copyright senza indicarne l'anno di decorrenza (e non c'è alcuna altra data nei volumi), cosa che appare illegale ed è comunque una pratica non etica che renderà difficile, in futuro, stabilire quando ne cesserà la protezione.
Comunque, al di là dei dettagli legali che possono essere a volte complicati e degli intrecci aziendali che possono esserlo altrettanto, quello che è chiaro, sicuro, di vaste dimensioni, già notato e discusso da molti in rete ma non - a quanto mi risulta - dai bibliotecari, è che per questa strada moltissime pubblicazioni che non sono coperte da copyright risultano di fatto, in Google Books, presenti ma non visualizzabili.

La "stranezza" - per non dir altro - di quest'attività è stata notata già un paio d'anni fa anche da «Publishers weekly», la principale rivista americana d'informazione sull'editoria2, e il marchio BiblioBazaar si è guadagnato perfino una voce in Wikipedia (inglese).
Nel 2011, il rapporto di Bowker sulla produzione libraria del 20103, basato sugli ISBN assegnati, ha dato il "curioso" risultato che ben l'87% dei titoli pubblicati nell'anno appartiene a 4 marchi, i soliti BiblioBazaar, General Books, Kessinger e Books LLC, nell'ordine. BiblioBazaar ha dichiarato di aver pubblicato, nell'anno, quasi un milione e mezzo di titoli (per la precisione 1.461.918). Il dato si commenta da solo.
Naturalmente non c'è niente di illecito nel produrre e vendere riproduzioni di libri fuori copyright, cosa che fanno da lungo tempo molti seri editori di ristampe anastatiche: illecita sarebbe però l'utilizzazione di digitalizzazioni altrui (di Google, di Internet Archive, di biblioteche, ecc.) che vengono messe a disposizione solo per usi non commerciali.
Quello che comunque interessa segnalare, al di là di eventuali illeciti e della evidente distorsione delle statistiche editoriali, è il massiccio effetto di "sparizione" di materiali dal pubblico dominio, a seguito di questa (e altre) pratiche. E le biblioteche sicuramente dovrebbero impegnarsi molto di più, come già avviene nel campo dell'Open Access, per difendere l'accesso libero a tutto ciò che rientra nel dominio pubblico e vigilare contro ogni forma di "scippo" dei diritti degli utenti.

2. Cosa vedo io e cosa vedono gli altri?

La seconda questione che mi sembra utile segnalare riguarda specificamente l'Italia (e forse, più in generale, l'Europa). Tutti sanno che le ricerche in Google danno risultati differenti a seconda del paese da cui l'interrogazione proviene, e tutti sanno anche che la differenza può essere in qualche caso molto vistosa: p.es., digitando «tienanmen» in Google Immagini, nella prima schermata appare una quantità di carri armati, mentre, per motivi ben noti, queste immagini "scompaiono" quando la ricerca è effettuata dalla Cina.
Cosa c'entra questo con Google Books e con l'Italia? Fino ad averne trovato segnalazione poco più di un mese fa in un sito di medievisti tedeschi, non sapevo - e sicuramente tanti altri utenti italiani non sanno - che le ricerche di materiale di dominio pubblico in Google Books danno risultati molto differenti se eseguite dall'Italia o dagli Stati Uniti d'America. A pensarci, certo, lo si poteva sospettare, ma a me non era venuto in mente.
Google Books permette in genere di visualizzare e scaricare le pubblicazioni italiane edite fino al 1865 circa - salvo il fenomeno già ricordato dei "finti copyright" e tante altre esclusioni (o inclusioni) più o meno misteriose. Negli Stati Uniti, però, dato che il copyright locale inizia dall'anno 1923, le pubblicazioni italiane tra il 1865 e il 1922 sono molto spesso - anche se non sempre - liberamente scaricabili. La differenza non è poca: quasi 60 anni di pubblicazioni, in un periodo molto importante e produttivo per la cultura italiana.
La stessa limitazione patita dall'utente italiano, o comunque una limitazione analoga, vale probabilmente anche per gli altri paesi europei (sicuramente per la Spagna, dove ho verificato di persona).
Si può aggirare questa limitazione? Certamente sì, con un po' di pazienza, e a quanto mi risulta senza infrangere alcuna legge. Occorre, semplicemente, iniziare le ricerche in Google Books da un servizio proxy che venga considerato da Google come americano, o equiparato all'area americana. Lo scotto, però, può essere una maggiore lentezza, e a volte inefficienza, del collegamento.

L'utilizzazione di un proxy di questo tipo, inoltre, può essere molto utile, per lo stesso motivo, anche per accedere alla Digital Library di HathiTrust, il deposito del materiale digitalizzato dalle maggiori università americane. Per esempio, nel momento in cui scrivo (3 giugno 2012) una comune rivista italiana come l'«Archivio storico italiano» è visualizzabile, dall'Italia, solo fino all'anno 1871 (compreso), mentre tramite un proxy è possibile visualizzare anche altre 51 annate (1872-1922). Purtroppo HathiTrust offre liberamente solo la visualizzazione per singola pagina, anche quando il materiale è completamente libero da diritti, e quindi il suo uso risulta molto pesante e macchinoso per l'utente comune.
Tornando a Google Books, è da segnalare inoltre che, purtroppo, anche negli Stati Uniti, la visualizzazione negli ultimi tempi si arresta spesso all'anno 1908 (e non al 1922), a quanto si suppone per un'interpretazione restrittiva di un procedimento giudiziario, molto contestato, che si applica peraltro solo agli Stati più occidentali dell'Unione. In questi casi quindi il vantaggio di utilizzare un proxy scende a una quarantina di anni. Comunque, anche con questo (ingiustificato) limite il materiale italiano aggiuntivo a cui si può accedere è moltissimo: p.es., nel nostro campo, la Relazione della commissione d'inchiesta sulla Biblioteca Vittorio Emanuele (1880) che ho citato come esempio nell'articolo precedente, e numerose annate della «Rivista delle biblioteche» di Biagi e del «Bollettino» di Firenze.
Il ricercatore che utilizza Google Books è poi ulteriormente vessato, come si sa, da mancanze di volumi, duplicazioni, errori nei dati, scansioni difettose e malfunzionamenti di ogni genere e sorta. A questi noti inconvenienti se n'è aggiunto con notevole frequenza, negli ultimi mesi, un altro, che potrebbe dipendere dai lavori per la nuova piattaforma Google Play: per moltissimi libri che appaiono regolarmente scaricabili il download non va a buon fine (neanche con tentativi ripetuti a distanza di giorni o settimane, da postazioni diverse, con altri browser, ecc.), limitandosi a un file di 0 Kb ovviamente illeggibile. Il problema è stato segnalato da alcune settimane negli Stati Uniti, in genere ipotizzando che sia legato al passaggio alla nuova piattaforma, e con serie preoccupazioni che preluda a prossime ulteriori limitazioni del servizio per tutti: p.es. consentire solo la visione pagina per pagina, invece dello scarico del volume, o consentire l'accesso solo agli utenti registrati, o magari solo ai clienti paganti.

In ogni caso, le cose stanno purtroppo esattamente come notava un commento non identificato sul sito di «The Chronicle of Higher Education»: «Google is accountable to no one and can therefore do as it pleases with all the data they've been accumulating, whether scans of library books or information extracted from your personal email. Having made the world dependent on its services, Google can now withdraw those services at will, or start charging for them, or do anything else with them that it chooses to do, and there's very little that the rest of us can do about it».
A parte il ben noto totale disinteresse di Google per l'informazione al pubblico e la trasparenza, e l'imprevedibilità dei suoi passi futuri riguardo al libero accesso al materiale digitalizzato, quello che emerge chiaramente dall'andamento recente, almeno da un paio d'anni a questa parte, è la progressiva restrizione o limitazione dell'accesso libero: applicazioni restrittive della giungla normativa del copyright e del diritto americano (come nel caso della limitazione al 1908, dell'esclusione di libri non americani anteriori al 1923, ecc.), evidente disinteresse per ogni accertamento delle condizioni di copyright che sarebbe invece utile al pubblico, massicci inquinamenti dei metadati e malfunzionamenti di ogni sorta.
Google è un'impresa privata finalizzata esclusivamente al profitto, e quindi - sia chiaro - non ha alcun dovere di lavorare nell'interesse dei suoi utenti (non paganti). Ma diventa a ogni passo più evidente che le speranze in una sorta di "Babbo Natale" della biblioteca digitale erano illusioni mal riposte e che dobbiamo adoperarci, al più presto possibile e al meglio possibile, per servizi di biblioteca digitale pubblici e credibili, che non potranno mai venire da Google.

3. Grandi manovre nel big business

Nel frattempo Google, che è sempre in movimento su vari fronti, ha compiuto due mosse di grande rilievo. Innanzitutto, è passato a produrre anche "ferraglia": acquisendo la Motorola, è infatti entrato di prepotenza nella produzione di telefoni cellulari - e non solo di software per gli smartphone - e, a quanto si dice, è intenzionato a inserirsi con la sua forza anche in quella dei tablet, che è il campo in cui si ripongono in questo momento le maggiori speranze di rapidi guadagni.
La strategia non è particolarmente innovativa, ispirandosi al successo raggiunto negli ultimi anni dalla Apple, rispetto alle altre grandi corporations del settore: integrazione tra hardware e software e sviluppo di nuovi apparecchi mobili, di richiamo anche come gadgets, così da garantirsi ampi margini di utile (che non ci sono più da molti anni per apparecchi tradizionali come i PC).
L'altra mossa importante è l'apertura (ancora parziale e con funzionalità non attive, al momento in cui scrivo, ma in crescita di giorno in giorno) di Google Play, che ha assorbito anche Google Books: in sostanza, un megastore di prodotti digitali (almeno per ora), apps, giochi, musica, video, libri, ecc.
Google Play si autodefinisce «il più grande eBookstore del mondo» e il concorrente di riferimento, per questo ambito, immagino sia Amazon, che però al momento (una precisazione sempre da ricordare) gestisce una maggiore varietà di prodotti e una quota rilevante di vendite di libri su carta (che Google Play non tratta), anche se da tempo sta indirizzandosi sempre più verso il digitale.

Il megastore di Google si presenta al possibile cliente con lo slogan «Un mondo di intrattenimento gratis», mentre poi, evidentemente, la stragrande maggioranza dei prodotti è offerta a pagamento. La gratuità insomma continua a essere adoperata come fonte di attrazione, specchietto per le allodole, con lo scopo di convertire al più presto il navigatore curioso in un cliente pagante.
Cosa hanno in comune queste due mosse, l'ingresso nella produzione di apparecchi e il lancio di Google Play? Entrambe mostrano che Google si va allontanando dal suo "nocciolo" di partenza, quello di un servizio di ricerca dell'informazione (liberamente accessibile), verso la produzione e la vendita di prodotti di consumo e di intrattenimento di massa.
Giocattoli per adulti, insomma, hardware e software, che costituiscono il mercato più attraente per far soldi (anche questo è piuttosto triste, come fenomeno sociale, ma lasciamo perdere). Contando sulle mode, sul fracasso mediatico e della rete, sull'indebolimento del consumatore chiamato a "consolarsi" in qualche modo, di come va il mondo, con l'acquisto di qualche gadget fresco fresco (quando non con il gioco d'azzardo, il cui fatturato è cresciuto in Italia nel 2011, l'anno di peggiore crisi economica e di pessimismo sul futuro, del 30% circa) 4.
Sembra quindi che, almeno per il momento, Google abbia raffreddato, se non lasciato cadere, le sue ambizioni di entrare di forza nel mercato dell'informazione scientifica e professionale (mercato specializzato ma, come si sa, ad altissimo rendimento), forse anche a seguito dello scacco del Google Books Settlement, e secondo alcuni commenti avrebbe già ridotto e rallentato anche l'impegno nel settore della digitalizzazione del materiale a stampa.
È verosimile, in effetti, che il mercato dei prodotti di consumo di massa costituisca uno sbocco economicamente più attraente per una corporation molto cresciuta e ambiziosa.
In queste tendenze di evoluzione del big business è interessante, naturalmente, anche il capitolo Facebook, finito nei giorni scorsi sulle prime pagine per il "bidone" della quotazione in borsa. Come si sa, l'ingresso di Facebook in borsa, al Nasdaq (18 maggio 2012) è stato lanciato da grandi banche d'affari americane e dai media con valutazioni e previsioni fantasmagoriche: poi, nei primi cinque giorni di contrattazione, chi aveva abboccato all'amo dell'offerta iniziale ha perso quasi il 20% del capitale investito. Sono seguite, inevitabili, le recriminazioni e anche le azioni legali e le indagini giudiziarie, per appurare se lo spennamento dei risparmiatori sia avvenuto in maniera lecita o illecita.
Gli sviluppi sia delle vicende giudiziarie che di quelle finanziarie sono incerti (nel momento in cui scrivo la perdita, dopo aver sfiorato un terzo del capitale, oscilla intorno al 25%) e vi sono previsioni differenti sulle dimensioni e gli esiti di questa manovra. C'è chi pensa che la bolla speculativa scoppi e altri che più ottimisticamente ritengono che rimarrà soltanto una "ordinaria" operazione di spennamento degli investitori creduloni - montati anche dalla complicità dei media - fino all'assestamento del titolo a un valore ragionevole rispetto al fatturato (che non dà segni di aumenti significativi, per i cattivi risultati della pubblicità, con grandi imprese che disinvestono per il suo basso rendimento, dovuto alla scarsa integrazione e funzionalità rispetto alla utilizzazione del sistema, oltre che alla pesante manipolazione del canale e dei suoi dati quantitativi).

In questa turbolenza naturalmente entra anche Google, che oltre ad aver lanciato nel 2011 la propria alternativa a Facebook (rimasta però per ora al quarto posto tra i social network più gettonati, con meno di un decimo degli utilizzatori di Facebook) ha recentemente attaccato la concorrenza per la sua gestione "gelosa" dei dati personali degli utenti. Dati che, sia per Google che per Facebook, costituiscono notoriamente una delle principali risorse monetizzate, in barba alla privacy (che negli Stati Uniti non è protetta come in Europa) e all'ingenuità degli utilizzatori.
Peraltro anche Facebook, secondo una fresca anticipazione del «New York Times», sta preparando il suo sbarco nella "ferraglia", lavorando in segreto - il solito segreto di Pulcinella - alla realizzazione per il prossimo anno di un suo smartphone. Seguendo, quindi, i passi di Google, che a sua volta segue quelli di Apple. Mentre Apple, a quanto si dice, vorrebbe entrare con forza nel settore televisivo, dopo primi cauti tentativi, con la sua smart television (iTV?).
Le linee di tendenza, insomma, sono molto chiare: giocattoli per adulti e intrattenimento di massa. Tendenze che è bene conoscere, come quelle - a cui si vanno avvicinando - della televisione commerciale e dei videogiochi, ma che ovviamente hanno a che fare poco o niente, in positivo, con la funzione delle biblioteche.

4. E le biblioteche?

Con lo spostamento di Google in direzione di servizi commerciali di consumo di massa, che hanno molto poco a che fare con la biblioteca digitale e l'accesso all'informazione per finalità che vadano al di là dell'intrattenimento e dell'uso del tempo libero, bisogna quindi archiviare gli ingenui entusiasmi, l'illusione che esista un danaroso Babbo Natale che scarichi la coscienza delle biblioteche e le tante chiacchiere connesse. Dovrebbe diventare finalmente chiaro che Google e le biblioteche stanno in settori molto differenti e hanno interessi non meno diversi e divergenti.
Per fortuna, qua e là nel mondo delle biblioteche qualcosa si muove: p.es. si estendono le attività di digitalizzazione delle biblioteche canadesi (e anche di alcune importanti biblioteche statunitensi) in collaborazione con Internet Archive, con risultati qualitativi molto migliori di quelli di Google e un accesso effettivamente libero.
Ma si può ricordare anche, in Europa, lo sviluppo e l'arricchimento di funzioni di Gallica. Purtroppo invece Europeana è resa quasi inutilizzabile dalle pessime caratteristiche del suo software di ricerca e consultazione: basti dire che non gestisce una tabella dei caratteri per la ricerca (inserendo «bibliothèque», «bibliotheque» o «bibliothéque» si ottengono tre risultati differenti, oltre che inesatti) e non informa l'utente se la digitalizzazione è quella di un libro o solo del suo frontespizio. Sembra persistere anche la tradizionale ottusità dell'Unione Europea nell'investire le (scarse) risorse non nella digitalizzazione dei contenuti, che è ciò che occorre, bensì in ennesimi, vuoti e ripetitivi progetti informatici, in cui è stato già sprecato un fiume di denaro pubblico.

Anche in Italia, pur nell'assenza ormai cronica di un'iniziativa autorevole a livello nazionale, lo spirito positivo che non manca in tanti singoli istituti fa crescere il nostro patrimonio di contenuti digitali (che già non è poco) e di informazioni per trovarli agevolmente (che soprattutto difettano). Si possono citare p.es., nel primo ambito, la digitalizzazione integrale della vecchia serie degli «Atti della Società ligure di storia patria», tuttora molto utilizzata dagli studiosi, e nel secondo la comparsa nell'Indice di SBN, con varie modalità, di più frequenti segnalazioni della disponibilità di digitalizzazioni (si vedano p.es. il record della rivista «La rivoluzione liberale» e quelli del «Don Pirlone» e di altri periodici della Repubblica romana posseduti dalla Biblioteca di storia moderna e contemporanea). La tragica carenza di fondi e di personale, insomma, non deve diventare un alibi per l'inerzia, quando molte cose utili possono essere realizzate facilmente con buon senso, semplicità e cooperazione.
Ma, tornando al quadro internazionale, un grande banco di prova della capacità di realizzare un servizio pubblico non commerciale è certo la Digital Public Library of America (DPLA) lanciata da Robert Darnton con il sostegno di numerose e prestigiose istituzioni e fondazioni. All'inizio di aprile è stato ufficialmente annunciato il lancio del servizio entro un anno, per l'aprile 2013, e la notizia ha ottenuto il dovuto rilievo nei maggiori mezzi d'informazione in tutto il mondo. I lavori procedono alacremente e un importante evento pubblico di presentazione e discussione è stato organizzato, sempre nell'aprile scorso, a San Francisco.

Tuttavia, le biblioteche (a parte Harvard) e i bibliotecari americani sono stati quasi completamente assenti nell'avvio dell'iniziativa e i segni di risveglio che sembrano dare negli ultimi tempi lasciano perplessi. Oltre alle speciose disquisizioni contro l'impiego del termine "Public" nel nome della DPLA, vari commenti danno la chiara impressione di "remare contro", forse per gelosia, e soprattutto sembrano cercare di deviare il progetto dalle sue finalità iniziali di accesso libero e gratuito alla più ampia varietà di materiale a cui è possibile fare accedere liberamente (antico e recente, specializzato e non, ecc.) verso il vicolo cieco di un qualche sistema di licenza collettiva a pagamento per i best-sellers e le novità dell'editoria di consumo. Come se questa fosse l'esigenza e la finalità principale, se non unica, delle biblioteche pubbliche "reali". Il solito errore, insomma, di inseguire il big business sul suo terreno e nelle direzioni che fanno comodo solo a lui. Mentre non fanno comodo, anzi vanno a scapito, di chi non è un big business, come non lo sono le biblioteche, e di chi non è interessato solo all'ultimo (ed effimero) successo di massa.
È chiaro che le biblioteche pubbliche devono dare accesso anche alla produzione commerciale pompata dal big business e dai media che ne dipendono. Ma dovrebbe essere ancor più chiaro, almeno ai bibliotecari, che concentrare l'attenzione (e il mercato) in quella direzione, invece che verso un'offerta il più possibile diversificata, plurale, con uno spessore cronologico e non ispirata solo da finalità commerciali, è una pessima mossa per le biblioteche, per la cultura (compresa, tra l'altro, la piccola e media editoria) e anche per la democrazia.


[1] «I had confirmed with our specialists that this is a metadata error. We have requested the correction», http://productforums.google.com/forum/#!category-topic/books/google-books-searching-and-discovering/4b8Bj0HTtxE. Altri messaggi sono recuperabili ricercando parti di questa risposta.

[2]Andrew Albanese, BiblioBazaar: how a company produces 272,930 books a year, «Publishers weekly», 15 April 2010, disponibile a http://www.publishersweekly.com/pw/by-topic/industry-news/publisher-news/article/42850-bibliobazaar-how-a-company-produces-272-930-books-a-year.html.

[3]Print isn't dead, says Bowker's Annual Book Production Report http://www.bowker.com/en-US/aboutus/press_room/2011/pr_05182011.shtml.

[4] Può essere interessante notare che, sempre secondo i dati ufficiali dell'amministrazione tributaria, il fatturato del gioco d'azzardo (legale, escluso quello illecito o sommerso) in Italia è quadruplicato dal 1994 al 2005 e poi ancora triplicato tra il 2005 e il 2011. La crescita è continuata perfino nel primo trimestre del 2012 (+11% nel fatturato della sola Lottomatica).