Computergestützte Werkzeuge für die Forschung zu De Bello Gallico
Dieses Projekt stellt computergestützte Werkzeuge bereit, die entwickelt wurden, um sprachwissenschaftliche und philologische Forschungen zum klassischen lateinischen Text De Bello Gallico von Gaius Iulius Caesar zu unterstützen. Diese Werkzeuge wurden konzipiert, um verschiedene Arten der Textanalyse zu erleichtern und eine detaillierte und automatisierte Untersuchung des Korpus zu ermöglichen.
1. Korpusanalyse (Thematische Glossare)
Dieses Werkzeug ermöglicht die Suche nach bestimmten Begriffen im Text von De Bello Gallico und erstellt thematische Glossare auf Grundlage des klassischen lateinischen Wörterbuchs von Lewis & Short. Derzeit ist es für die Erkennung militärischer Begriffe konfiguriert, kann aber problemlos auf andere Themenbereiche angepasst werden. Das Ergebnis wird im JSON-Format bereitgestellt.
Zugang: github.com/LeoVichi/caesar_lexikon
2. N-Gramm-Analyse
Unter Verwendung der Stanza-Bibliothek der Stanford University erstellt dieses Skript eine detaillierte Analyse von Bigrammen und Trigrammen (semantische Beziehungen zwischen aufeinanderfolgenden Begriffen) sowie eine lexikalische Klassifikation der Wörter (PoS – Part of Speech). Die Ausgaben sind CSV-Dateien, die Häufigkeitsindizes der Vorkommen im Text enthalten.
Zugang: github.com/LeoVichi/caesar_corpus
3. Lemmatisierer mit Frequenzanalyse und Visualisierung
Dieses Skript lemmatisiert den lateinischen Text automatisch, indem es Wörter in ihre Wörterbuchform umwandelt (z. B. „partem“ zu „pars“, „legiones“ zu „legio“). Anschließend erstellt es eine quantitative Analyse der häufigsten Begriffe im Text. Der Code ist modular aufgebaut und ermöglicht die Erstellung von Visualisierungen wie Wortwolken und Balkendiagrammen, die speziell auf lexikalische Kategorien wie Verben, Substantive, Adjektive und Adverbien ausgerichtet sind.
Zugang: github.com/LeoVichi/caesar_freq
4. Automatischer Lexikograph
Dieses Werkzeug sammelt und analysiert lexikographisch die häufig vorkommenden Begriffe (vom Nutzer definierbar, derzeit ab mindestens fünf Vorkommen). Die Begriffe werden lemmatisiert, lexikalisch klassifiziert und ihre Definitionen aus dem Lewis-&-Short-Wörterbuch extrahiert. Für Substantive und Adjektive werden auch die jeweiligen Deklinationen angegeben.
Derzeit bestehen einige Einschränkungen, z. B. dass bestimmte Begriffe aufgrund komplexer Definitionen im Originalwörterbuch nicht automatisch erkannt werden. Um diese teilweise zu umgehen, werden nicht definierte Begriffe für eine spätere manuelle Analyse gesammelt. Eine integrierte Version mit einer KI-API zur Verbesserung und Vereinfachung der Definitionen ist in Entwicklung.
Zugang: github.com/LeoVichi/caesar_dicionario
Diese Werkzeuge sind kostenlos verfügbar und zielen darauf ab, akademische Forschung in den Bereichen klassische Studien, historische Linguistik und lateinische Philologie zu unterstützen und zu fördern.