Entropia e Geração de Séries de Aproximação utilizando uma ferramenta JAVA
Leopoldo Rabelo, Renato de Moraes

DOI: 10.14209/sbrt.2008.42539
Evento: XXVI Simpósio Brasileiro de Telecomunicações (SBrT2008)
Keywords: Entropia estrutura da linguagem JAVA séries de aproximação Teoria da Informação
Abstract
Este artigo descreve uma ferramenta de código aberto desenvolvida na linguagem de programação JAVA que obtém o cálculo aproximado da entropia de uma língua natural através do uso de textos em formato digital da língua em questão. Nossa ferramenta também permite automatizar o processo de geração de séries de aproximação da linguagem, seja pela utilização de n-gramas, seja por fontes de Markov. Foram reproduzidos os resultados de Claude E. Shannon para a língua inglesa a título de validação, e em seguida, foram obtidos os resultados para a língua portuguesa. A ferramenta desenvolvida e aqui descrita pode ser utilizada tanto didaticamente no ensino da disciplina Teoria da Informação, como pode também ser empregada para estudos mais gerais de codificação de fonte, cálculo de entropia, compressão de dados, como também em estudos de estrutura da linguagem.

Download