A Compilação de um Corpus Formado por Textos de Biologia em Inglês: algumas observações sobre vocabulário científico

Purificación Sánchez Hernández

Resumo


Este artigo trata da elaboração de um corpus de textos de Biologia organizado como um todo mas composto por diferentes sub-disciplinas. A compilação do corpus foi realizada levando-se em consideração os créditos atribuídos às diferentes sub-áreas nos estudos de Biologia na Universidade e também o impacto científico e social dos assuntos. Nosso corpus possui 2.500.00 palavras, sendo que uma porcentagem de 84% do total de textos é devotada a periódicos científicos e 16% a livros. Da mesma forma, 70% dos textos compilados são provenientes de fontes norte-americanas e 30% de fontes britânicas. Inicialmente, focalizamos os aspectos lexicais do corpus. Em primeiro lugar, demonstramos a utilidade do nosso corpus especializado em comparação com um corpus de inglês geral. Após compilar os textos, extraímos as 150 palavras mais freqüentes de cada arquivo. Conforme era esperado, as freqüências mais altas são aquelas correspondentes a formas gramaticais. Uma seleção dos termos técnicos e sub-técnicos presentes nesses arquivos revelou que a densidade lexical mais alta é encontrada nos livros. Da mesma forma, provamos que a organização que propusemos serve aos nossos propósitos, no que se refere aos termos lexicais.

Palavras-chave


corpus; biologia; vocabulário científico

Texto completo:

PDF (English)

Métricas do artigo

Carregando Métricas ...

Metrics powered by PLOS ALM


Indexicadores

Apoio

A Revista The Especialist e os textos aqui publicados estão licenciados com uma Lincença Creative Commons: Atribuição 4.0 Internacional (CC BY 4.0)