Strumenti computazionali per la ricerca sul De Bello Gallico

Il progetto mette a disposizione strumenti computazionali sviluppati per supportare ricerche linguistiche e filologiche sul testo latino classico De Bello Gallico di Giulio Cesare. Questi strumenti sono progettati per facilitare diverse analisi testuali, permettendo un’esplorazione dettagliata e automatizzata del corpus.

1. Analisi del Corpus (Glossari Tematici)

Questo strumento consente di cercare termini specifici nel testo del De Bello Gallico, generando glossari tematici basati sul dizionario classico di latino di Lewis & Short. Attualmente configurato per individuare termini militari, può essere facilmente adattato ad altri insiemi tematici. Il risultato è fornito in formato JSON.

Accesso: github.com/LeoVichi/caesar_lexikon

2. Analisi di n-grammi

Utilizzando la libreria Stanza dell’Università di Stanford, questo script genera analisi dettagliate di bigrammi e trigrammi (relazioni semantiche tra termini consecutivi) e una classificazione lessicale delle parole (PoS – Part of Speech). Le uscite sono file in formato CSV, tutti contenenti indici di frequenza delle occorrenze nel testo.

Accesso: github.com/LeoVichi/caesar_corpus

3. Lemmatizzatore con analisi di frequenza e visualizzazione

Questo script lemmatizza automaticamente il testo latino, trasformando le parole nelle loro forme di dizionario (ad esempio, “partem” in “pars”, “legiones” in “legio”). Successivamente, genera un’analisi quantitativa dei termini più frequenti nel testo. Il codice è modulare e consente di creare visualizzazioni come nuvole di parole e grafici a barre specifici per categorie lessicali, come verbi, sostantivi, aggettivi e avverbi.

Accesso: github.com/LeoVichi/caesar_freq

4. Lessicografo automatico

Questo strumento raccoglie ed esegue un’analisi lessicografica dei termini riscontrati con alta frequenza (definibile dall’utente, attualmente impostata su un minimo di cinque occorrenze). I termini vengono lemmatizzati, classificati lessicalmente e le loro definizioni vengono estratte dal dizionario di Lewis & Short. Per sostantivi e aggettivi vengono anche indicate le rispettive declinazioni.

Attualmente, esistono alcune limitazioni in fase di risoluzione, come termini non rilevati automaticamente a causa della complessità delle definizioni nel dizionario originale. Per aggirare parzialmente questo limite, i termini non definiti vengono separati per un’analisi manuale successiva. È in fase di sviluppo una versione integrata con un’API di intelligenza artificiale per migliorare e semplificare le definizioni estratte.

Accesso: github.com/LeoVichi/caesar_dicionario

Questi strumenti sono disponibili gratuitamente e mirano a sostenere e promuovere la ricerca accademica negli studi classici, nella linguistica storica e nella filologia latina.