Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools

Autores

  • Tony Berber Sardinha Pontifícia Universidade Católica de São Paulo

Palavras-chave:

Corpora, WordSmith Tools, léxico chave

Resumo

Um dos procedimentos mais delicados envolvidos numa análise de corpus via palavras-chave com WordSmith Tools KeyWords é a seleção de um sub-conjunto de palavras para serem investigadas em detalhe. A seleção se faz necessária, via de regra, porque o tamanho do léxico chave de um corpus de estudo é em geral muito grande, em geral em torno de 1500 palavras ou até mais. Uma maneira de fazer esse recorte consiste na extração de palavras-chave exclusivas. O léxico chave exclusivo é composto das palavras-chave que ocorrem somente no corpus de estudo em questão em comparação com palavras-chave de outros corpora de estudo. Contudo, comparar a lista de palavras-chave com várias outras é um procedimento custoso e complicado, que não pode ser exigido da maioria dos usuários de WordSmith Tools KeyWords. Uma alternativa para este cenário seria a aplicação de um ponto de corte generalizado baseado em tendências de retorno de palavras-chave observadas através da aplicação do banco de palavras-chave existente. Tal ponto de corte indicaria a região da lista de palavras-chave na qual há maior probabilidade de ocorrência do léxico chave exclusivo. Os resultados obtidos aqui indicam um ponto de corte entre 31% a 53% das palavras da lista, a partir da primeira de uma lista ordenada por chavicidade.

Downloads

Publicado

2018-06-11

Como Citar

Sardinha, T. B. (2018). Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools. DELTA: Documentação E Estudos Em Linguística Teórica E Aplicada, 21(2). Recuperado de https://revistas.pucsp.br/index.php/delta/article/view/37692

Edição

Seção

Artigos