La linguistica dei corpora è una disciplina scientifica che esiste da circa cinquant’anni che, servendosi di strumenti di analisi quantitativa e statistica, esplora le regolarità linguistiche che emergono dai testi e che costituiscono la base per la descrizione della struttura del linguaggio.
In questo modo, si riesce a individuare sfumature che potrebbero essere trascurate dai linguisti che lavorano manualmente, o schemi di grandi dimensioni che non sarebbero rivelati in un’intera vita di studio. Il conteggio delle parole e il tenere traccia di dove siano usate le parole, sono due aspetti fondamentali di questo tipo di ricerche.
Un team di ricercatori dell’Università di Lancaster ha messo sotto la lente d’ingrandimento dei computer un gruppo di circa 20 mila parole selezionate da una raccolta di testi scritti di William Shakespeare che comprendeva (milioni di parole). Un lavoro che ha permesso di creare una sorta di “dizionario di Shakespeare”.
Non si tratta di un’idea nuova: in passato sono stati già costruiti dizionari del genere, ma è la prima volta che è stato impiegato l’interso arsenale delle tecniche della linguistica dei corpora e, soprattutto, è la prima opera “comparativa” di questo tipo. Infatti, le parole all’interno dell’opera di Shakespeare sono messe a confronto con scritti della prima età moderna (un corpus di milioni di parole) e con 320 milioni di parole provenienti da varie opere contemporanee del Cigno dell’Avon.
Per esempio, se l’uso del termine “bastardo”, riferito a un fiore, era generalmente un termine effettivamente presente in testi tecnici di orticoltura (riferito ovviamente a pianta ibrida), nell’opera di Shakespeare, come nel Re Lear, è utilizzato su una persona, Edmund, ma non in senso dispregiativo o offensivo, bensì per sottolineare il suo status di figlio illegittimo, “geneticamente ibrido”.
Inoltre, Shakespeare faceva un uso particolare anche della parola “cattivo” che associava, per esempio, alla parola “successo”, per indicare una non buona “riuscita” di un’impresa. “Cattivo successo” non è una espressione molto frequente, oggi. L’analisi ha permesso di capire più profondamente il “carattere” di una determinata parola attraverso le parole con cui tendeva a ricorrere, un po’ come se giudicassimo una persona sulla base delle compagnie che frequenta. Con questa modalità, si può scoprire che il significato di “successo” era simile a “risultato”, più che a “successo” come lo intendiamo oggi, e quindi esso poteva essere “buono” o “cattivo”.
Nell’opera di Shakespeare ci sono poi parole molto frequenti come “ah”, oppure “alas” (“ahimé”), che sono però pesantemente utilizzate soprattutto dai personaggi femminili, con i quali svolgevano un lavoro emotivo, contraddistinguendo il lamento nelle rappresentazioni teatrali.
E gli hapax legomena, ossia le parole che ricorrono UNA sola volta in Shakespeare? Troviamo un interessante “bone-ache” (“dolore alle ossa”) che è stato usato solo in “Troilo e Cressida” e che evoca la sifilide. Invece, un altro haapax, più piacevole, è “ear-kissing” (“baciare le orecchie”), che compare in Re Lear ed è una piacevole e creativa metafora del “sussurrare”.
Perché questi progressi nella linguistica dei corpora storici stanno avvenendo proprio adesso? Gran parte della tecnologia per produrre questi risultati non è stata disponibile fino a tempi relativamente recenti. Parliamo di programmi per gestire le variazioni ortografiche (come Vard) o per analizzare vaste raccolte di testi elettronici in modi sofisticati (come CQPweb), non dimenticando le grandi quantità di dati linguistici della prima età moderna leggibili dal computer (come EEBO-TCP): tutti software ampiamente utilizzati solo negli ultimi dieci anni circa, we che contribuiranno ad aumentare significativo la nostra comprensione e apprezzamento di importanti scrittori come Shakespeare.
Trackback/Pingback