Uso de corpora comparáveis para fi ltrar dicionários bilíngues gerados por transitividade

Pablo Gamallo

Resumo


Este artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso método.

Palavras-chave


processamento da língua natural; extração de informação; corpora comparáveis; dicionários bilíngues

Texto completo:

PDF

Métricas do artigo

Carregando Métricas ...

Metrics powered by PLOS ALM


Revista Delta-Documentação e Estudos em Linguística Teórica e Aplicada ISSN 1678-460X