PhiN-Beiheft 1/1998: 28



Doris Messina (Turin)


Lo Zibaldone dei pensieri: un software in sostegno alla ricerca


The Zibaldone dei pensieri: a software-tool supporting research
Software-tools can assist research, insofar as they facilitate studies on thematic as well as on linguistic structures of literary texts. The programme Nota Bene was employed to demonstrate the linguistic variability in Leopardi's Zibaldone..


Da alcuni anni la ricerca trova supporto negli strumenti informatici che facilitano la gestione e l'analisi di opere complesse; si tratta di software che smembrano il testo in parti minime fino a ridurlo in elementi comparabili e quindi analizzabili. Gli analizzatori di testo – così sono chiamati tali strumenti – offrono una visione differente, asettica e distaccata dell'opera. Uno di questi, Nota Bene, è stato impiegato nella ricerca sullo Zibaldone, ricerca finalizzata alla verifica dell'esistenza di variabilità linguistica e tematica durante la stesura dell'opera. L'analisi è partita dalla realizzazione di elementi comparabili (divisione in anni solari del testo) e dalla considerazione della variabile quantità testuale delle sezioni.

La prima verifica riguarda la disparità notevole nella produzione, assolutamente non omogenea nel corso degli anni: le tre sezioni finali relative agli anni 1830, 1831, 1832 sono le più esigue; segue la sezione del 1819, anch'essa molto ridotta. I pensieri dell'anno 1819 sono costituiti unicamente da versi, e l'unico del 1830 riguarda l'aspetto filologico ed è costituito da una annotazione. Le sezioni più consistenti sono quelle relative agli anni 1821 con 1853 carte e 1823 con 1344 carte, che si presentano certamente superiori a tutte le altre per il numero di carte contenute.

Entriamo ora nello specifico del vocabolario leopardiano: ho scelto alcuni termini considerati parole chiave dell'opera e secondo tali termini, mi sono servita di Nota Bene, che per ogni sezione fornisce l'occorrenza numerica di ogni termine.

AMORE
ANIMALE
ANTICO
ARTE
BARBARIE
BELLEZZA
BELLO
CIVILTÀ
CORRUZIONE
CRISTIANESIMO
DESIDERIO
DESTINO
DIO
DOLORE
FANCIULLO
FANTASIA
FATO
FELICITÀ
FILOSOFIA
GIOVANE
ILLUSIONE
IMMAGINAZIONE
INDEFINITO
INFELICITÀ
INFINITO
LINGUA
MATERIA
MODERNO
NATURA
PERFETTIBILITÀ
PERFEZIONE
PIACERE
POESIA
POETICO
PRESENTE
PRIMITIVO
PROGRESSO
RAGIONE
RELIGIONE
SOCIETÀ
SPIRITO
STORIA
UOMO
VERITÀ
VERO




PhiN-Beiheft 1/1998: 29


Con un'operazione di sintesi, dalle parole selezionate distinguo cinque aree concettuali piuttosto vaste:

1) l'area del sentimento e della passione.
2) l'area del discorso sull'uomo.
3) l'area dell'arte.
4) l'area relativa all'aspetto religioso.
5) l'area filosofica.

A ciascuno di questi concetti corrispondono alcune tra le parole chiave che io ho identificato. Difficilmente le cinque aree possono essere nettamente separate in modo che ogni termine appartenga per il suo significato esclusivamente ad una singola area. Tale operazione permette però di riassumere in un unico dato quantitativo tutti i valori relativi ad una particolare area.


Analisi dei Grafici

Realizzando grafici a istogramma per ogni area concettuale ottengo la variazione di quell'area lungo l'arco dell'intera opera.



Area del Sentimento e della Passione:


Osservando il grafico, si nota che l'anno '20 rivela il maggior interesse. Nel corso dell'opera si osserva senz'altro una diminuzione dell'interesse per la passione ed il sentimento, in quanto il dato relativo all'anno '29 è superiore soltanto a quello dell'anno '28, mentre è inferiore a tutti gli altri; gradualmente i valori diminuiscono verso il minimo del '28 per poi risalire debolmente nel '29 e rimanere in ogni caso inferiori a tutti i dati precedenti il '28.




PhiN-Beiheft 1/1998: 30


Area Relativa all'Arte:


Il momento di massimo interesse per l'arte è negli anni 1817 - 1818. Il '20 rappresenta la diminuzione di circa due terzi. La prima sezione dell'opera rivela un interesse non più riscontrato per l'arte, e il grafico evidenzia una generale diminuzione dei dati. Bisogna comunque operare una distinzione: mi sembra importante rilevare che dal '20 al '25 il grafico assume un andamento parabolico molto regolare, mentre dal '25 al '29 si riscontra un progressivo aumento intervallato regolarmente da un anno di diminuzione della frequenza.



Area Relativa all'Uomo:


Il grafico relativo al discorso sull'uomo rivela subito un'irregolarità nell'anno '32: la frequenza in quest'anno è altissima rispetto al resto dell'opera. Bisogna tenere presente che in quest'anno Leopardi scrive solamente una carta per un totale di 214 parole. Il termine che influenza tale dato è uomo, che si presenta nove volte in quell'unica carta. Senza dubbio tale constatazione è da tenere presente, in quanto è notevole che nell'arco di un anno intero e di una sola carta, per un totale di sette pensieri, Leopardi tratti unicamente dell'uomo, e con tale argomento si concluda lo Zibaldone.

Dall'anno '18 al '20 l'aumento per l'interesse verso l'uomo è piuttosto spiccato. Gli anni '21, '22, '23, '26, '27, rivelano una costanza per tale argomento; l'anno '31 è di poco superiore a tali dati. Gli anni '24, '28 e '29 segnano invece una diminuzione nella frequenza. Per quanto si notino dei cali consistenti nelle frequenze, esse si mantengono comunque ad un livello piuttosto alto in tutti gli anni di stesura. La parte centrale dell'opera, compresa tra gli anni '21 e '27, rivela una presenza costante e ripetuta dell'argomento.




PhiN-Beiheft 1/1998: 31


Area Religiosa:


L'andamento dei valori dell'area religiosa si presenta piuttosto irregolare: l'attenzione dell'autore per questo argomento non è mai elevato. C'è però una punta di interesse maggiore nell'anno '20, in cui il dato supera di quasi tre volte il successivo. Per il resto, il grafico mostra un andamento abbastanza regolare, con un calo graduale dal '21 al '26 e con una ripresa esigua dal '26 al '29. L'ultima parte dello Zibaldone sembra totalmente disinteressata ai termini religiosi.



Area Filosofica:


L'argomento filosofico si mostra, piuttosto irregolare e privo di una direzione definita: non si può dire se Leopardi abbia proceduto nel senso di un maggiore o minore interesse per i termini filosofici. Si può solo notare che i primi due anni rappresentano una certa costanza, mentre il '21 è un periodo di innalzamento notevole del dato, che segnala un forte incremento dell'interesse per la filosofia nello Zibaldone. Il rilievo così consistente dura solo lo spazio di un anno, poiché seguono due cadute dei valori: uno dal '22 al '24, ed uno dal '25 al '28. La particolarità del grafico si rivela negli ultimi dati: nel '31 il valore è nullo, mentre nel '32 aumenta oltre il valore di novanta; bisogna però ricordare che tale valore è calcolato sul testo limitato di una sola carta, e che verificando, è il risultato di due termini, di bello e di verità, che si presentano una sola volta.




PhiN-Beiheft 1/1998: 32


Grafici a Confronto

Un dato che permette un confronto tra i grafici è la rilevazione dei valori estremi. Innanzi tutto, voglio sottolineare che né i minimi, né i massimi si presentano mai nell'intervallo tra gli anni '22 e '29, ma solo o nei primi tre anni ('18 - '21), o negli ultimi due ('31 - '32). Esaminando i valori massimi delle frequenze, ho notato che si riscontrano negli anni '20, '21, '32 e '18. Più in particolare, ho osservato che esiste un legame tra due grafici proprio in relazione all'anno di maggiore frequenza: il grafico relativo al sentimento ed alla passione e quello relativo alla religione hanno il dato massimo nell'anno '20.

Gli altri, invece, presentano il dato massimo in anni differenti: l'arte nel '18, l'uomo nel '32, e la filosofia nel '21.

Un'ulteriore osservazione riguarda l'esistenza di due tipi di sviluppo differenti nei grafici: il genere parabolico, che ho già definito in precedenza, risultante dal fatto che gli istogrammi compongono una curva a parabola più o meno regolare, ed un secondo tipo di sviluppo in cui i valori subiscono cali e successivi aumenti.

Nel primo caso rientrano gli anni dal '20 al '25 del grafico sull'arte: vi è prima un aumento progressivo fino ad un massimo toccato nel '22, e poi una altrettanto progressiva diminuzione, fino al '25.

Ha un andamento parabolico anche il grafico sulla religione negli anni dal '23 al '30, in cui il punto minimo è toccato nel '26, mentre i due massimi della parabola sono gli estremi dell'intervallo di tempo.

Il secondo tipo di sviluppo è evidente nel grafico relativo all'arte, nel periodo compreso tra il '24 ed il '29. I valori tendono ad aumentare, ma ciò avviene in maniera discontinua, con un aumento seguito da un calo, seguito a sua volta da un successivo aumento e così via.

La stessa considerazione vale per il grafico sul sentimento e sulla passione: tra il '23 ed il '29 l'interesse per l'argomento tende a diminuire, non gradualmente, ma con aumenti progressivi seguiti da bruschi cali, seguiti a loro volta da nuovi aumenti progressivi e limitati.

Le osservazioni sull'andamento del grafico comportano delle considerazioni sullo sviluppo di un argomento.

Un andamento di tipo parabolico corrisponde ad un interesse che subisce, o in negativo, o in positivo, uno sviluppo graduale. La riflessione di Leopardi giunge alla sua massima estensione per poi ridursi nuovamente, il tutto senza grossi salti di intensità, anzi con una certa regolarità.

Uno sviluppo del secondo tipo segnala invece una riflessione irregolare, costituita da riprese e abbandoni successivi dell'argomento. La prima conseguenza di tale osservazione è che nessun grafico si sviluppa interamente in una situazione di costanza. Solamente il grafico relativo all'uomo presenta una certa continuità, ma esclusivamente per l'intervallo tra il '21 ed il '27.

Per costanza intendo non solamente la stabilità dei dati intorno ad un valore, ma anche un aumento od un calo regolare: tutti gli argomenti sono svolti con fasi alterne di crescita e di diminuzione, mostrando così che tra il '17 ed il '30 Leopardi non abbandona mai del tutto nessun termine.




PhiN-Beiheft 1/1998: 33


Gli ultimi due anni di stesura offrono lo spunto per una riflessione ulteriore: per ciò che riguarda il sentimento e la passione, l'arte e la religione, in questi anni si registra un disinteresse totale. Si può obiettare come in precedenza che tale fatto sia dovuto all'esiguità del testo scritto negli ultimi due anni, anche se si nota che il valore maggiore nel grafico relativo all'argomento uomo è proprio nell'anno '32, valore che, oltre tutto, supera di molto tutti gli altri. In quest'anno Leopardi scrive solo una carta, ma essa è totalmente dedicata all'uomo. L'autore ha quindi operato una scelta precisa, ossia di dedicare la sua attenzione ad un solo argomento, escludendo radicalmente tutti gli altri.



Le scale dei grafici

Per ogni termine selezionato ho realizzato un istogramma, in cui sull'ascissa si trova la successione temporale, anno per anno, e sull'ordinata le occorrenze con cui si presenta ogni termine.



Amore:


Ritengo importante considerare la scala dei grafici in quanto essa indica la rilevanza assoluta delle parole nel testo: il valore massimo della scala è legato al valore massimo della frequenza di ogni termine; l'aumento della scala dipende quindi dall'aumento del valore massimo della frequenza del termine.

Tale dato costituisce una verifica circa l'intensità con cui si presenta ciascuna parola.

Ho suddiviso i valori in cinque fasce:

1) valori compresi tra 0 e 2
2) valori compresi tra 2 e 10
3) valori compresi tra 10 e 30
4) valori compresi tra 30 e 50
5) valori superiori a 50




PhiN-Beiheft 1/1998: 34


Tutti i termini rientrano in una delle cinque fasce:

valori 0-2

fato - indefinito - perfettibilità

valori2-10

Cristianesimo - destino - Dio - fanciullo - fantasia - giovane - progresso

valori 10-30

amore - civiltà - corruzione - infelicità - infinito - materia - moderno - perfezione - piacere - desiderio - felicità - filosofia - illusione - immaginazione - poetico - presente - primitivo - religione

valori 30-50

arte - bello - ragione - verità - vero

valori maggiori di 50

antico - barbarie - bellezza - lingua - natura - poesia - società - spirito - storia - uomo

Osservando la tabella, si nota che una grossa parte dei termini si concentra tra i valori di 10 e 30. Inoltre, riguardo le scale più basse, i termini riconducibili ad un argomento religioso si collocano in esse: cristianesimo - destino - Dio - fato

Questo discorso ha una sola eccezione: il termine religione si trova nella fascia tra 10 e 30, ma bisogna considerare che la sua scala è comunque piuttosto ridotta, poiché raggiunge il valore massimo di 14 e non supera quindi di molto l'intervallo della fascia inferiore. I termini religiosi si collocano tra i minori dello Zibaldone, poiché i rimangono costantemente su livelli di frequenza delle fasce più basse.

Quindi rilevo una serie di termini riconducibili ad un argomento definito: progresso - barbarie - civiltà - corruzione - moderno - presente - primitivo - storia - antico si possono ricondurre ad un costante raffronto tra l'antico ed il moderno, il passato ed il presente tramite un mutamento storico, di progresso o di corruzione. Tali termini si collocano per la maggior parte (barbarie - corruzione - presente - primitivo - storia) nella fascia centrale compresa tra i valori 10 e 30; progresso si colloca nella fascia inferiore tra i valori 2 e 10, e antico in quella superiore tra 30 e 50. Le considerazioni sull'antico e sul moderno assumono quindi una certa rilevanza, e costituiscono uno dei temi fondamentali dell'opera.

Sempre nella fascia centrale relativa ai valori compresi tra 10 e 30 si collocano alcuni termini che possono considerarsi riferiti all'aspetto sentimentale: amore - infelicità - desiderio - felicità - illusione - immaginazione; fatta eccezione per fantasia, che si trova nella fascia tra 2 e 10, tutti i termini relativi al sentimento si trovano in una posizione intermedia, denotando una certa rilevanza.

I termini che rientrano nella fascia più bassa sono fato - indefinito - perfettibilità, con una scala compresa tra 0 e 2 che rivela la poca rilevanza data a tali termini.

Nelle fasce degli intervalli superiori si collocano i termini riconducibili ad un argomento filosofico: filosofia tra 10 e 30, ragione , verità e vero (quest'ultimo se si considera anche il valore del '32) nella fascia superiore compresa tra 30 e 50, denotando un interesse consistente di Leopardi.




PhiN-Beiheft 1/1998: 35


Nelle fasce dei valori più alti si concentrano i termini relativi alle lettere e all'arte: nella fascia tra 30 e 50 rientra arte, e nella fascia dei valori superiori a 50 rientrano poesia e lingua. Poetico si colloca nella fascia più ricca di termini, tra 10 e 30. I termini riferiti all'argomento artistico sembrano quindi essere tra i principali proprio per le frequenze massime che risultano, che li collocano nelle fasce più elevate.

Estremamente rilevanti sono poi altri termini: ragione, che si colloca nella scala tra 30 e 50, natura ed uomo, che presentano la scala superiore a tutti gli altri termini.

Posso quindi stendere una sorta di classifica degli argomenti più frequenti:

1°) FILOSOFIA / ARTE
2°) ANTICO-MODERNO / SENTIMENTO
3°) RELIGIONE

Tale discorso sulla rilevanza numerica di ciascun termine si riferisce, però, solo al valore maggiore di ognuno: la scala è in rapporto al valore maggiore della frequenza di ogni termine, ma gli altri valori nello stesso grafico non si mantengono costanti. La mia analisi precedente si riferisce quindi, non ad un discorso generale sulla rilevanza delle parole in ogni anno, ma ad un aspetto specifico di esso, ossia la punta massima di frequenza del termine.

Corollario di tale considerazione, è che nessun grafico rivela una presenza costante dei termini in tutta l'opera, ma ogni parola subisce delle variazioni negli anni, confermando l'esistenza della variabilità nel vocabolario leopardiano.

 

Alcuni dati rilevanti

Considererò ora la massima presenza dei termini dal punto di vista temporale, ossia dell'anno in cui si rileva la frequenza maggiore. Nella tabella seguente sono illustrate le parole la cui frequenza è maggiore e l'anno in cui ciò si verifica:

'18

arte - bello - corruzione - fantasia - fanciullo - illusione - natura - poesia - ragione

'20

amore - Cristianesimo - Dio - felicità - immaginazione - presente - piacere - religione

'21

indefinito - perfezione - primitivo

'22

moderno - perfettibilità - verità - lingua

'23

destino - giovane

'24

infelicità

'25

filosofia - infinito

'26

progresso - storia

'27

civiltà - fato - materia

'29

poetico

'31

antico

'32

spirito - società - storia - uomo - vero - barbarie - bellezza




PhiN-Beiheft 1/1998: 36


Osservo ora singolarmente gli anni: nel '18 vi sono i massimi dei termini riferiti all'arte, in particolare a poesia, mentre il massimo di lingua si trova nel '22. Nel '20 si concentra la maggioranza dei termini relativi alla religione, ossia Cristianesimo, Dio, religione.

Nel '26 i massimi rinviano a considerazioni sullo sviluppo della civiltà umana, con progresso e storia. Nel '18, nel '20 e nel '26 i massimi dei termini sono riconducibili ad argomenti particolari: l'arte intesa come poesia, la religione, e la storia e il progresso. La stessa distinzione non si verifica negli altri anni, in cui i valori massimi delle frequenze sono riferiti a termini vari, riconducibili a più argomenti; negli anni suddetti invece, non si tratta solo dell'aumento massimo della frequenza di un termine, ma di più termini riferiti ad un medesimo argomento. Facendo un parallelo tra tale considerazione e i grafici relativi alle aree semantiche, osservo che il valore massimo dell'area artistica è nell'anno '18, e il valore massimo dell'area religiosa è nell'anno '20. Quindi c'è corrispondenza tra il massimo valore dell'intera area semantica, risultante dalla somma delle frequenze dei diversi termini, e i massimi valori dei singoli termini.

Per ciò che riguarda gli altri anni, è possibile distinguere delle particolarità: tra le parole chiave ne rilevo alcune che sono in contrapposizione tra di loro: antico - moderno, spirito - materia, natura - ragione. Le prime due coppie di termini sono in opposizione nel loro significato letterale, la terza non costituisce un'opposizione letterale, ma nello Zibaldone è frequente una contrapposizione tra lo stato di natura e la ragione:

[Ago.1817...Dic.1818]
Gran verità, ma bisogna ponderarle bene. La ragione è nemica d'ogni grandezza: la ragione è nemica della natura: la natura è grande, la ragione è piccola. (Carta n° 14)

Considerando quindi tali coppie come termini in opposizione, ho osservato in quali anni si verifica la loro maggiore presenza: antico - moderno si collocano entrambi nell'anno '22, se però si esclude il valore massimo di antico dell'anno '31; spirito - materia si trovano nell'anno '27, sempre escludendo il valore massimo di spirito dell'anno '32; natura e ragione rientrano entrambe nell'anno '18. Si verifica quindi una presenza vicendevole dei termini in opposizione: entrambi raggiungono il valore massimo di frequenza nello stesso anno.

Insomma, i nuovi strumenti per la ricerca sono da ricercare nell'informatica. Si tratta di software che consentono soprattutto di dominare l'opera, di gestirla in maniera agile e flessibile attraverso una serie di dati estrapolati meccanicamente e sempre attraverso il filtro dei criteri specifici del ricercatore.