Alcune distrazioni possono causare assuefazione, far perdere tempo, ma al tempo stesso renderci orgoglios* e farci sentire brillanti. Tra queste una delle mie preferite è cercare parole con Google Books Ngram Viewer e fare finta di essere una linguista computazionale.

Che cos’è Google Books Ngram Viewer?

È un motore di ricerca che permette di scoprire con quale frequenza una parola o più parole legate tra loro compaiono nell’insieme di libri pubblicati tra il 1500 e il 2008 (per ora) e presenti in Google Books.

Per ogni ricerca si ottiene un grafico che mostra la percentuale con cui una data espressione è frequente nelle opere pubblicate in un dato anno. Per effettuare una ricerca – che può anche mettere a confronto diverse parole o gruppi di parole tra loro – è necessario specificare la lingua delle opere che si vogliono prendere in considerazione. Non tutte le lingue sono disponibili, e per l’inglese è possibile distinguere tra English, American English, British English e English (Fiction), ovvero considerando le sole opere di narrativa.

Quindi, ad esempio, se cerco “Virginia Woolf” (attenzione, il sistema è case-sensitive, quindi bisogna mettere le maiuscole al loro posto, a meno che non si specifichi il contrario) ottengo risultati diversi a seconda della lingua che scelgo:

virginia AE

(Se cliccate sulle immagini potete ingrandirle.)

virginia BE

Si possono anche mettere a confronto i risultati che si ottengono nelle varie lingue e ad esempio scoprire che alla fine degli anni Ottanta Virginia Woolf era molto citata nei libri pubblicati nel Regno Unito, molto più di adesso, e che dal 2001 circa il suo nome è più ricorrente nelle opere pubblicate in italiano rispetto a quelle pubblicate negli Stati Uniti.

virginia woolf confronto

Ricordate il film The Hours, tratto dall’omonimo romanzo di Michael Cunningham e per cui Nicole Kidman ha vinto l’Oscar per l’interpretazione di Virginia Woolf? Be’, è uscito nel 2002. Se lo scrivo è perché la cosa più divertente che si può fare con Google Books Ngram Viewer, oltre a togliersi qualche curiosità, è cercare di immaginare perché a un certo punto una parola diventi più o meno popolare. Certe volte non è difficile fare delle ipotesi perché i risultati che si ottengono confermano le previsioni che potremmo fare.

Alcune ricerchine serie

Ho cercato di capire quanto sia stata popolare la parola “femminismo” nei libri pubblicati in italiano.

Negli anni della lotta per il suffragio universale la parola ha cominciato a comparire nelle opere pubblicate in italiano, in parte nello stesso periodo in cui si usava il termine “suffragette”. Il termine femminismo è poi tornato in auge negli anni Settanta, mentre dal 1987 al 2008 si vede una diminuzione della frequenza con cui è usato, nulla di sorprendente insomma.

femminismo e suffragette

Poi ho fatto lo stesso con “aborto” e ho provato a confrontare italiano, inglese, spagnolo e francese (non conosco il tedesco, ma mi è sorto il dubbio che per via dei casi della lingua la ricerca avrebbe potuto portare a conclusioni scorrette).

Sarebbe stato bello poter isolare i libri pubblicati in Irlanda, dove un organo preposto alla censura ha potuto vietare la diffusione di opere che sostenevano il diritto all’aborto fino al 1992. In ogni caso, qualcosa nel risultato di questa ricerca mi ha stupita: voi come ve lo spiegate il picco nelle opere italiane pubblicate negli anni Trenta?

aborto

L’unica cosa che è venuta in mente a me è che vista l’enfasi che durante il fascismo era posta sul moltiplicarsi degli italiani in patria e nelle “terre dell’impero”, la parola “aborto” venisse usata in senso negativo, del tipo “fate tanti figli e non fate affaticare le donne gravide perché sennò poi perdono i bambini”.

Poi ho controllato quanto fossero frequenti le parole “gay”, in inglese e in italiano, confrontate con “omosessuale” (e “homosexual”) e “lesbica” (e “lesbian”). Su “transgender” non avevo grandi aspettative, e infatti:

LGBT

Alcune ricerchine più sceme

Ovviamente la maggior parte del tempo che perdo cercando parole su Google Books Ngram Viewer non lo passo a cercare cose serie, piuttosto confronto diverse cose che mi piacciono e provo a vedere se ci sono più “avocado” che “brillantini”, e poi “avocado” e “paillettes” (gli anni Ottanta non deludono).

Si possono confrontare anche “Beatles” e “Rolling Stones” (nel grafico che segue la linea blu e quella verde si riferiscono ai libri italiani) e notare quello che a me fa venire in mente il salto di una cavalletta nella politica italiana dal 1945 al 2008 (la scritta “All” tra parentesi significa che gli ho chiesto di non distinguere tra lettere maiuscole e minuscole).

beatles vs rolling stones

berlusconi cavalletta

E poi ovviamente si possono dare risposte a dubbi mai soddisfatti…

fica figa

…e a domande che non sapevate nemmeno di poter fare, tipo: quand’è che internet è diventata più popolare di Barbie in italiano? Risposta: nel 1989.

barbie internet

Il vero grande difetto di Google Books Ngram Viewer è che tiene conto dei libri, ma non degli articoli. Immaginate che bello fare queste stesse ricerche incrociando i dati sui libri con quelli su riviste e giornali da una parte e televisione e cinema dall’altra. Se già vi si incrociano le meningi ma siete esaltatissim*, allora siete portat* per le distrazioni da linguisti computazionali dilettanti.