Opzioni
Reading the Italian Novel at a Distance (1830-1930)
RIND
PRIN
operative
Data di inizio
12 Dicembre 2023
Data di fine
28 Febbraio 2026
Abstract
Sulla base dell’approccio teorico proposto da Franco Moretti, il progetto è volto a condurre esperimenti di Distant Reading su un corpus di 1000 romanzi di autori italiani e tradotti da altre lingue e pubblicati tra il 1830 e il 1930. Il corpus sarà bilanciato per tenere conto della distribuzione degli autori/traduttori, il loro genere, la data di pubblicazione, la lunghezza e la tipologia dei testi (letteratura alta e di consumo).
Le analisi su un’ampia mole di dati riguarderanno gli aspetti sincronico e diacronico, applicando metodologie statistiche e computazionali, e si concentreranno su due obiettivi: l’identificazione delle modalità con cui i personaggi dei romanzi esprimono i loro pensieri e sentimenti (espressione dell’interiorità) e la periodizzazione dei cambiamenti sociali descritti nei testi oggetto di esame.
Il primo obiettivo trarrà beneficio da approcci quantitativi e dall’estrazione automatica dei dati testuali per studiare fenomeni pragmalinguistici percepibili a livello testuale (scil. eccedenti i confini frastici). Il secondo si basa su elenchi di lemmi per stabilire come categorie professionali, gradi militari, ruoli negli ordinamenti religiosi, come pure gli edifici (residenziali, commerciali, industriali, religiosi, militari, rurali, urbani ecc.) riflettano l’evoluzione sociale nel corso del periodo considerato.
Entrambi gli obiettivi sono innovativi poiché finora risultano rari i tentativi di utilizzare metodi quantitativi e automatici ai fini dell’analisi del discorso riportato e della periodizzazione dei romanzi pubblicati in Italia, secondo approcci diversi da quelli della critica letteraria tradizionale. Inoltre, il confronto tra testi scritti da autori italiani e traduzioni da altre lingue permetterà studiare più nel dettaglio l’influenza esercitata da modelli esogeni sulla produzione letteraria nazionale in prosa.
Il Progetto ricomprende principalmente tre discipline: la linguistica italiana, ai fini dell’identificazione dei tratti morfosintattici caratterizzanti strutture pragmatiche e della redazione di elenchi lessicali in grado di rispecchiare campi semantici utili alla periodizzazione delle opere; la statistica (ivi compresi metodi di deep machine learning) ai fini della topic detection e content analysis basate su word embedding, in modo da estrarre le serie temporali e visualizzare i dati in maniera efficace tramite mappe e grafici; la letteratura comparata, ai fini dell’interpretazione dei risultati sullo sfondo della storia della letteratura italiana, europea e mondiale.
Un ruolo fondamentale sarà svolto dall’identificazione e operazionalizzazione dei dati testuali. Di conseguenza, il progetto intende fornire un contributo innovativo e interdisciplinare a livello teorico e metodologico, sfruttando congiuntamente conoscenze e metodi propri delle discipline linguistiche, letterarie e statistiche.
The research project entitled “Reading the Italian Novel at a Distance (1830-1930)” is based on an interdisciplinary approach combining methods that have produced innovative results in recent literary and linguistic studies, i.e. computational and corpus linguistics, quantitative literary studies, data science, statistics and translation studies.
Based on Franco Moretti’s seminal approach, the project aims to conduct distant reading experiments on a corpus of 1000 Italian novels, as well as novels translated into Italian from other languages, published between 1830 and 1930. The corpus will be balanced to account for the distribution of authors/translators and their gender, publication date, text length, and artistic and popular literature.
Large-scale data-driven analyses will be conducted from both a synchronic and diachronic perspective through statistical and computational methods. The analyses will focus on two main objectives: detecting how the fictional characters express their thoughts and emotions, and identifying social changes in the novels under scrutiny.
The first objective will implement quantitative approaches and automatic data extraction to study pragma-linguistics phenomena emerging at textual level, i.e., exceeding word and sentence boundaries. The second objective exploits lemma lists to detect how job titles, military ranks, religious titles, along with buildings (residential, commercial, industrial, religious, rural, urban etc.) reflect social changes.
Both objectives are innovative, since so far little attempt has been made to use quantitative and automatic methods to analyse reported speech and produce a periodization of novels published in Italy according to criteria other than literary criticism. Moreover, the comparison between novels written in Italian and translations from other languages will shed light on the influence of foreign models on Italian literary prose.
The project draws mainly from three disciplines: linguistics to identify morphological and syntactic traits leading to pragmatic patterns and lexical lists encompassing semantic fields for periodization purposes; statistics (including deep machine learning methods) to classify texts by means of topic detection and content analysis based on word embedding to extract data time series and devise data visualisation methods (charts and graphs); comparative literature to interpret the results against the background of the history of Italian, European and world literature.
A paramount role in the research is played by the identification of linguistic data and their operationalization within Italian literature. Thus, the project aims to provide a theoretical and methodological contribution through the joint exploitation of knowledge and methods pertaining to linguistics, literary, and statistical studies.
CER
SH5_12 - Computational modelling and digitisation in the cultural sphere
SH5_2 - Theory and history of literature, comparative literature
SH4_11 - Pragmatics, sociolinguistics, linguistic anthropology, discourse analysis
SSD
Settore SECS-S/05 - Statistica Sociale
Settore L-LIN/12 - Lingua e Traduzione - Lingua Inglese
Settore L-FIL-LET/14 - Critica Letteraria e Letterature Comparate
Settore SECS-S/01 - Statistica
Settore L-FIL-LET/12 - Linguistica Italiana
Finanziatore
MINISTERO DELL'UNIVERSITA' E DELLA RICERCA
Grant number
2022JAYFJH
Importo
92314.4
Contributore(i)
TREVISANI MATILDE
PALUMBO GIUSEPPE
Partner(i)
Università degli Studi di ROMA Tor Vergata
Università degli Studi di TRIESTE
Università degli Studi di PADOVA
Ruolo
Partner
Coordinatore
Partner