Doris Messina (Turin) Lo Zibaldone dei pensieri: un software in sostegno alla ricerca Software-tools can assist research, insofar as they facilitate studies on thematic as well as on linguistic structures of literary texts. The programme Nota Bene was employed to demonstrate the linguistic variability in Leopardi's Zibaldone.. Da alcuni anni la ricerca trova supporto negli strumenti informatici che facilitano la gestione e l'analisi di opere complesse; si tratta di software che smembrano il testo in parti minime fino a ridurlo in elementi comparabili e quindi analizzabili. Gli analizzatori di testo – così sono chiamati tali strumenti – offrono una visione differente, asettica e distaccata dell'opera. Uno di questi, Nota Bene, è stato impiegato nella ricerca sullo Zibaldone, ricerca finalizzata alla verifica dell'esistenza di variabilità linguistica e tematica durante la stesura dell'opera. L'analisi è partita dalla realizzazione di elementi comparabili (divisione in anni solari del testo) e dalla considerazione della variabile quantità testuale delle sezioni. La prima verifica riguarda la disparità notevole nella produzione, assolutamente non omogenea nel corso degli anni: le tre sezioni finali relative agli anni 1830, 1831, 1832 sono le più esigue; segue la sezione del 1819, anch'essa molto ridotta. I pensieri dell'anno 1819 sono costituiti unicamente da versi, e l'unico del 1830 riguarda l'aspetto filologico ed è costituito da una annotazione. Le sezioni più consistenti sono quelle relative agli anni 1821 con 1853 carte e 1823 con 1344 carte, che si presentano certamente superiori a tutte le altre per il numero di carte contenute. Entriamo ora nello specifico del vocabolario leopardiano: ho scelto alcuni termini considerati parole chiave dell'opera e secondo tali termini, mi sono servita di Nota Bene, che per ogni sezione fornisce l'occorrenza numerica di ogni termine.
PhiN-Beiheft 1/1998: 29 Con un'operazione di sintesi, dalle parole selezionate distinguo cinque aree concettuali piuttosto vaste: 1) l'area del sentimento e della passione. A ciascuno di questi concetti corrispondono alcune tra le parole chiave che io ho identificato. Difficilmente le cinque aree possono essere nettamente separate in modo che ogni termine appartenga per il suo significato esclusivamente ad una singola area. Tale operazione permette però di riassumere in un unico dato quantitativo tutti i valori relativi ad una particolare area. Analisi dei Grafici Realizzando grafici a istogramma per ogni area concettuale ottengo la variazione di quell'area lungo l'arco dell'intera opera. Osservando il grafico, si nota che l'anno '20 rivela il maggior interesse. Nel corso dell'opera si osserva senz'altro una diminuzione dell'interesse per la passione ed il sentimento, in quanto il dato relativo all'anno '29 è superiore soltanto a quello dell'anno '28, mentre è inferiore a tutti gli altri; gradualmente i valori diminuiscono verso il minimo del '28 per poi risalire debolmente nel '29 e rimanere in ogni caso inferiori a tutti i dati precedenti il '28. PhiN-Beiheft 1/1998: 30 Dall'anno '18 al '20 l'aumento per l'interesse verso l'uomo è piuttosto spiccato. Gli anni '21, '22, '23, '26, '27, rivelano una costanza per tale argomento; l'anno '31 è di poco superiore a tali dati. Gli anni '24, '28 e '29 segnano invece una diminuzione nella frequenza. Per quanto si notino dei cali consistenti nelle frequenze, esse si mantengono comunque ad un livello piuttosto alto in tutti gli anni di stesura. La parte centrale dell'opera, compresa tra gli anni '21 e '27, rivela una presenza costante e ripetuta dell'argomento. PhiN-Beiheft 1/1998: 31 PhiN-Beiheft 1/1998: 32 Grafici a Confronto Un dato che permette un confronto tra i grafici è la rilevazione dei valori estremi. Innanzi tutto, voglio sottolineare che né i minimi, né i massimi si presentano mai nell'intervallo tra gli anni '22 e '29, ma solo o nei primi tre anni ('18 - '21), o negli ultimi due ('31 - '32). Esaminando i valori massimi delle frequenze, ho notato che si riscontrano negli anni '20, '21, '32 e '18. Più in particolare, ho osservato che esiste un legame tra due grafici proprio in relazione all'anno di maggiore frequenza: il grafico relativo al sentimento ed alla passione e quello relativo alla religione hanno il dato massimo nell'anno '20.Gli altri, invece, presentano il dato massimo in anni differenti: l'arte nel '18, l'uomo nel '32, e la filosofia nel '21. Un'ulteriore osservazione riguarda l'esistenza di due tipi di sviluppo differenti nei grafici: il genere parabolico, che ho già definito in precedenza, risultante dal fatto che gli istogrammi compongono una curva a parabola più o meno regolare, ed un secondo tipo di sviluppo in cui i valori subiscono cali e successivi aumenti. Nel primo caso rientrano gli anni dal '20 al '25 del grafico sull'arte: vi è prima un aumento progressivo fino ad un massimo toccato nel '22, e poi una altrettanto progressiva diminuzione, fino al '25. Ha un andamento parabolico anche il grafico sulla religione negli anni dal '23 al '30, in cui il punto minimo è toccato nel '26, mentre i due massimi della parabola sono gli estremi dell'intervallo di tempo. Il secondo tipo di sviluppo è evidente nel grafico relativo all'arte, nel periodo compreso tra il '24 ed il '29. I valori tendono ad aumentare, ma ciò avviene in maniera discontinua, con un aumento seguito da un calo, seguito a sua volta da un successivo aumento e così via. La stessa considerazione vale per il grafico sul sentimento e sulla passione: tra il '23 ed il '29 l'interesse per l'argomento tende a diminuire, non gradualmente, ma con aumenti progressivi seguiti da bruschi cali, seguiti a loro volta da nuovi aumenti progressivi e limitati. Le osservazioni sull'andamento del grafico comportano delle considerazioni sullo sviluppo di un argomento. Un andamento di tipo parabolico corrisponde ad un interesse che subisce, o in negativo, o in positivo, uno sviluppo graduale. La riflessione di Leopardi giunge alla sua massima estensione per poi ridursi nuovamente, il tutto senza grossi salti di intensità, anzi con una certa regolarità. Uno sviluppo del secondo tipo segnala invece una riflessione irregolare, costituita da riprese e abbandoni successivi dell'argomento. La prima conseguenza di tale osservazione è che nessun grafico si sviluppa interamente in una situazione di costanza. Solamente il grafico relativo all'uomo presenta una certa continuità, ma esclusivamente per l'intervallo tra il '21 ed il '27. Per costanza intendo non solamente la stabilità dei dati intorno ad un valore, ma anche un aumento od un calo regolare: tutti gli argomenti sono svolti con fasi alterne di crescita e di diminuzione, mostrando così che tra il '17 ed il '30 Leopardi non abbandona mai del tutto nessun termine. PhiN-Beiheft 1/1998: 33 Gli ultimi due anni di stesura offrono lo spunto per una riflessione ulteriore: per ciò che riguarda il sentimento e la passione, l'arte e la religione, in questi anni si registra un disinteresse totale. Si può obiettare come in precedenza che tale fatto sia dovuto all'esiguità del testo scritto negli ultimi due anni, anche se si nota che il valore maggiore nel grafico relativo all'argomento uomo è proprio nell'anno '32, valore che, oltre tutto, supera di molto tutti gli altri. In quest'anno Leopardi scrive solo una carta, ma essa è totalmente dedicata all'uomo. L'autore ha quindi operato una scelta precisa, ossia di dedicare la sua attenzione ad un solo argomento, escludendo radicalmente tutti gli altri. Le scale dei grafici Per ogni termine selezionato ho realizzato un istogramma, in cui sull'ascissa si trova la successione temporale, anno per anno, e sull'ordinata le occorrenze con cui si presenta ogni termine. Ritengo importante considerare la scala dei grafici in quanto essa indica la rilevanza assoluta delle parole nel testo: il valore massimo della scala è legato al valore massimo della frequenza di ogni termine; l'aumento della scala dipende quindi dall'aumento del valore massimo della frequenza del termine. Tale dato costituisce una verifica circa l'intensità con cui si presenta ciascuna parola. Ho suddiviso i valori in cinque fasce: 1) valori compresi tra 0 e 2 PhiN-Beiheft 1/1998: 34 Tutti i termini rientrano in una delle cinque fasce:
Osservando la tabella, si nota che una grossa parte dei termini si concentra tra i valori di 10 e 30. Inoltre, riguardo le scale più basse, i termini riconducibili ad un argomento religioso si collocano in esse: cristianesimo - destino - Dio - fato Questo discorso ha una sola eccezione: il termine religione si trova nella fascia tra 10 e 30, ma bisogna considerare che la sua scala è comunque piuttosto ridotta, poiché raggiunge il valore massimo di 14 e non supera quindi di molto l'intervallo della fascia inferiore. I termini religiosi si collocano tra i minori dello Zibaldone, poiché i rimangono costantemente su livelli di frequenza delle fasce più basse. Quindi rilevo una serie di termini riconducibili ad un argomento definito: progresso - barbarie - civiltà - corruzione - moderno - presente - primitivo - storia - antico si possono ricondurre ad un costante raffronto tra l'antico ed il moderno, il passato ed il presente tramite un mutamento storico, di progresso o di corruzione. Tali termini si collocano per la maggior parte (barbarie - corruzione - presente - primitivo - storia) nella fascia centrale compresa tra i valori 10 e 30; progresso si colloca nella fascia inferiore tra i valori 2 e 10, e antico in quella superiore tra 30 e 50. Le considerazioni sull'antico e sul moderno assumono quindi una certa rilevanza, e costituiscono uno dei temi fondamentali dell'opera. Sempre nella fascia centrale relativa ai valori compresi tra 10 e 30 si collocano alcuni termini che possono considerarsi riferiti all'aspetto sentimentale: amore - infelicità - desiderio - felicità - illusione - immaginazione; fatta eccezione per fantasia, che si trova nella fascia tra 2 e 10, tutti i termini relativi al sentimento si trovano in una posizione intermedia, denotando una certa rilevanza. I termini che rientrano nella fascia più bassa sono fato - indefinito - perfettibilità, con una scala compresa tra 0 e 2 che rivela la poca rilevanza data a tali termini. Nelle fasce degli intervalli superiori si collocano i termini riconducibili ad un argomento filosofico: filosofia tra 10 e 30, ragione , verità e vero (quest'ultimo se si considera anche il valore del '32) nella fascia superiore compresa tra 30 e 50, denotando un interesse consistente di Leopardi. PhiN-Beiheft 1/1998: 35 Nelle fasce dei valori più alti si concentrano i termini relativi alle lettere e all'arte: nella fascia tra 30 e 50 rientra arte, e nella fascia dei valori superiori a 50 rientrano poesia e lingua. Poetico si colloca nella fascia più ricca di termini, tra 10 e 30. I termini riferiti all'argomento artistico sembrano quindi essere tra i principali proprio per le frequenze massime che risultano, che li collocano nelle fasce più elevate. Estremamente rilevanti sono poi altri termini: ragione, che si colloca nella scala tra 30 e 50, natura ed uomo, che presentano la scala superiore a tutti gli altri termini. Posso quindi stendere una sorta di classifica degli argomenti più frequenti: 1°) FILOSOFIA / ARTE Tale discorso sulla rilevanza numerica di ciascun termine si riferisce, però, solo al valore maggiore di ognuno: la scala è in rapporto al valore maggiore della frequenza di ogni termine, ma gli altri valori nello stesso grafico non si mantengono costanti. La mia analisi precedente si riferisce quindi, non ad un discorso generale sulla rilevanza delle parole in ogni anno, ma ad un aspetto specifico di esso, ossia la punta massima di frequenza del termine. Corollario di tale considerazione, è che nessun grafico rivela una presenza costante dei termini in tutta l'opera, ma ogni parola subisce delle variazioni negli anni, confermando l'esistenza della variabilità nel vocabolario leopardiano.
Alcuni dati rilevanti Considererò ora la massima presenza dei termini dal punto di vista temporale, ossia dell'anno in cui si rileva la frequenza maggiore. Nella tabella seguente sono illustrate le parole la cui frequenza è maggiore e l'anno in cui ciò si verifica:
PhiN-Beiheft 1/1998: 36 Osservo ora singolarmente gli anni: nel '18 vi sono i massimi dei termini riferiti all'arte, in particolare a poesia, mentre il massimo di lingua si trova nel '22. Nel '20 si concentra la maggioranza dei termini relativi alla religione, ossia Cristianesimo, Dio, religione. Nel '26 i massimi rinviano a considerazioni sullo sviluppo della civiltà umana, con progresso e storia. Nel '18, nel '20 e nel '26 i massimi dei termini sono riconducibili ad argomenti particolari: l'arte intesa come poesia, la religione, e la storia e il progresso. La stessa distinzione non si verifica negli altri anni, in cui i valori massimi delle frequenze sono riferiti a termini vari, riconducibili a più argomenti; negli anni suddetti invece, non si tratta solo dell'aumento massimo della frequenza di un termine, ma di più termini riferiti ad un medesimo argomento. Facendo un parallelo tra tale considerazione e i grafici relativi alle aree semantiche, osservo che il valore massimo dell'area artistica è nell'anno '18, e il valore massimo dell'area religiosa è nell'anno '20. Quindi c'è corrispondenza tra il massimo valore dell'intera area semantica, risultante dalla somma delle frequenze dei diversi termini, e i massimi valori dei singoli termini. Per ciò che riguarda gli altri anni, è possibile distinguere delle particolarità: tra le parole chiave ne rilevo alcune che sono in contrapposizione tra di loro: antico - moderno, spirito - materia, natura - ragione. Le prime due coppie di termini sono in opposizione nel loro significato letterale, la terza non costituisce un'opposizione letterale, ma nello Zibaldone è frequente una contrapposizione tra lo stato di natura e la ragione:
Considerando quindi tali coppie come termini in opposizione, ho osservato in quali anni si verifica la loro maggiore presenza: antico - moderno si collocano entrambi nell'anno '22, se però si esclude il valore massimo di antico dell'anno '31; spirito - materia si trovano nell'anno '27, sempre escludendo il valore massimo di spirito dell'anno '32; natura e ragione rientrano entrambe nell'anno '18. Si verifica quindi una presenza vicendevole dei termini in opposizione: entrambi raggiungono il valore massimo di frequenza nello stesso anno. Insomma, i nuovi strumenti per la ricerca sono da ricercare nell'informatica. Si tratta di software che consentono soprattutto di dominare l'opera, di gestirla in maniera agile e flessibile attraverso una serie di dati estrapolati meccanicamente e sempre attraverso il filtro dei criteri specifici del ricercatore. |