Uso de corpora comparáveis para fi ltrar dicionários bilíngues gerados por transitividade
Palavras-chave:
processamento da língua natural, extração de informação, corpora comparáveis, dicionários bilínguesResumo
Este artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso método.Downloads
Publicado
2014-09-24
Como Citar
Gamallo, P. (2014). Uso de corpora comparáveis para fi ltrar dicionários bilíngues gerados por transitividade. DELTA: Documentação E Estudos Em Linguística Teórica E Aplicada, 30(2). Recuperado de https://revistas.pucsp.br/index.php/delta/article/view/6268
Edição
Seção
Artigos