Riqueza Lexical

     A riqueza lexical é uma medida estatística, uma relação que se estabelece entre o número de palavras repetidas e diferentes de um texto e o número total de palavras nele encontradas. Trata-se, assim, da razão entre o número de palavras diferentes (types) e o número de total de palavras (tokens). Quanto maior for o número de types, maior será a riqueza e a variedade do vocabulário. Quanto menor for o número, mais repetitivo é o texto.


Exemplo:
São procurados profissionais para as funções de Agente de Combate às Endemias (300 vagas), Supervisor de Campo (30 vagas) e Biólogo – Supervisor Geral de Campo (3 vagas). (DG 22/03/2008)


Número de palavras diferentes (types): 22
Número total de palavras (tokens): 27


Riqueza Lexical (%) = types x 100                  22 x 100 = 81,48%
                                               tokens                           27


Isso quer dizer que a frase tem um percentual de variedade de vocabulário de 81, 48%. Apenas 18,52% do universo das palavras são repetidos (de, vagas).


Para mais informações sobre riqueza lexical:
BERBER SARDINHA, Tony. Lingüística de Corpus. São Paulo: Manole, 2004 (p.94)