Uso de corpora comparáveis para fi ltrar dicionários bilíngues gerados por transitividade

Autores

  • Pablo Gamallo Universidade de Santiago de Compostela

Palavras-chave:

processamento da língua natural, extração de informação, corpora comparáveis, dicionários bilíngues

Resumo

Este artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso método.

Biografia do Autor

Pablo Gamallo, Universidade de Santiago de Compostela

Born 27 July 1969 at Vigo, Galiza, Spain Current Positions: “Ramón y Cajal” Researcher, University of Santiago de Compostela, Spain. Departamento de Língua Espanhola, Área de Linguística Computacional. Promoter and founder member of Cilenis, a Spin-Off on language technologies qualified as IEBT by the Galician government EDUCATION Mars 1998, Ph.D in Linguistics, Blaise Pascal University, France. October 1993, Master on Linguistics, Logic and Computing, Blaise Pascal University, France. July 1992, Graduated in Hispanic Languages, University of Santiago de Compostela, Galiza, Spain PREVIOUS POSITIONS 2004 - 2007 “Parga Pondal" Reseacher, University of Santiago de Compostela, Spain 2002 - 2004 Post-Doc supported by Fundação da Ciência e a Tecnologia (FCT), Ref: SFRG / BDP / 1189 / 2002, Group CITI, Faculdade de Ciência e Tecnologia, Universidade Nova de Lisboa, Portugal. 2000 - 2002 Post-Doc supported by Fundação da Ciência e a Tecnologia (FCT), PRAXIS XXI / BDP / 2213 / 99, Group CENTRIA, Faculdade de Ciência e Tecnologia, Universidade Nova de Lisboa, Portugal. 1999 - 2000 Auxiliar Professor (Asociado P3) at University of Vigo, Spain 1998 -1999 Auxiliar Professor (ATER) at University of Blaise Pascal, France

Downloads

Publicado

2014-09-24

Como Citar

Gamallo, P. (2014). Uso de corpora comparáveis para fi ltrar dicionários bilíngues gerados por transitividade. DELTA: Documentação E Estudos Em Linguística Teórica E Aplicada, 30(2). Recuperado de https://revistas.pucsp.br/index.php/delta/article/view/6268

Edição

Seção

Artigos