

14) called “verse-spectral reading”, an operation able of revealing “more than 500 decasyllables in the book, among sapphic and heroic verses, and more than two hundred dodecasyllables. They were selected because they constitute the main corpus of one of the most important Portuguese-language writers, and because Os Sertões was the object of what Augusto de Campos (2010, p. We present the system, and a preliminary validation analysing three works by Euclides da Cunha (Os Sertões, À Margem da História, Contrastes e Confrontos). It is able to identify, classify and compare, frequency, density and dispersion of heterometric structures of versification, distributed at different scales of observation, from a work or author, to historical periods and movements. The MIVES (Mining Verse Structure) system was developed for computational scansion of metric versification structures in Portuguese language prose. Palavras-Chave: estruturas de versificação prosa mineração de versos Euclides da Cunha.Ībstract: Versification structures written in Portuguese language prose are still an unexplored phenomenon to literary theorists and historians, and the automatic mining of such structures is still unseen in Computational Linguistics.


Pode-se afirmar que MIVES inaugura novos padrões de observação e análise de estruturas ainda não investigadas na prosa literária de língua portuguesa. MIVES identificou estruturas métricas em 48,18% das sentenças de Os Sertões, 48,96% de À Margem da História e 37,48% de Contrastes e Confrontos, uma taxa surpreendente, quando comparada aos resultados exibidos por Augusto de Campos. Elas foram selecionadas porque constituem o corpus principal de um dos mais importantes prosadores de língua portuguesa e porque Os Sertões foi objeto do que Augusto de Campos chamou de “leitura verso-espectral”, uma operação capaz de revelar “mais de 500 decassílabos na obra”. Apresentamos o sistema, e fazemos uma validação preliminar dele em três obras de Euclides da Cunha (Os Sertões, À Margem da História, Contrastes e Confrontos). Ele é capaz de identificar, classificar e comparar, frequência, densidade e dispersão de estruturas heterométricas de versificação, distribuídas em diversas escalas de observação - de uma obra ou autor, até períodos e movimentos literários. O sistema MIVES (Mining Verse Structure) foi desenvolvido para escansão computacional de estruturas métricas de versificação em prosa de língua portuguesa. Resumo: Estruturas de versificação em prosa de língua portuguesa constituem um fenômeno ainda inexplorado por teóricos e historiadores da literatura, e a mineração automática de tais estruturas é inédita em Linguística Computacional.
