Ferramentas Computacionais para Pesquisa no De Bello Gallico
O projeto disponibiliza ferramentas computacionais desenvolvidas para apoiar pesquisas linguísticas e filológicas sobre o texto latino clássico De Bello Gallico, de Júlio César. Essas ferramentas foram projetadas para facilitar diferentes análises textuais, permitindo uma exploração detalhada e automatizada do corpus.
1. Análise de Corpus (Glossários Temáticos)
Esta ferramenta permite buscar termos específicos no texto do De Bello Gallico, gerando glossários temáticos com base no dicionário clássico de latim Lewis & Short. Atualmente configurada para localizar termos militares, pode facilmente ser adaptada para outros conjuntos temáticos. O resultado é disponibilizado em formato JSON.
Acesso: github.com/LeoVichi/caesar_lexikon
2. Análise de n-grams
Utilizando a biblioteca Stanza da Universidade de Stanford, este script gera análises detalhadas de bigramas e trigramas (relações semânticas entre termos consecutivos) e uma classificação lexical das palavras (PoS – Part of Speech). As saídas são arquivos em formato CSV, todos contendo índices de frequência das ocorrências no texto.
Acesso: github.com/LeoVichi/caesar_corpus
3. Lematizador com Análise de Frequência e Visualização
Este script lematiza automaticamente o texto latino, transformando palavras em suas formas de dicionário (por exemplo, “partem” para “pars”, “legiones” para “legio”). Em seguida, gera uma análise quantitativa dos termos mais frequentes no texto. O código é modular e permite criar visualizações como nuvens de palavras e gráficos de barras específicos para categorias lexicais, como verbos, substantivos, adjetivos e advérbios.
Acesso: github.com/LeoVichi/caesar_freq
4. Lexicógrafo Automático
Esta ferramenta realiza a coleta e análise lexicográfica dos termos encontrados com alta frequência (definível pelo usuário, atualmente com frequência mínima de cinco aparições). Os termos são lematizados, classificados lexicalmente, e suas definições são extraídas do dicionário Lewis & Short. Para substantivos e adjetivos, também são informadas as respectivas declinações.
Atualmente, há algumas limitações sendo trabalhadas, como termos que não são encontrados automaticamente devido à complexidade das definições no dicionário original. Para contornar parcialmente essa limitação, os termos não definidos são separados para análise manual posterior. Está em desenvolvimento uma versão integrada a uma API de IA para melhorar e simplificar as definições extraídas.
Acesso: github.com/LeoVichi/caesar_dicionario
Essas ferramentas estão disponíveis gratuitamente e visam apoiar e fomentar pesquisas acadêmicas em estudos clássicos, linguística histórica e filologia latina.