Pesquisadora organiza corpus do português popular

O CorPop é um registro da língua média do brasileiro na atualidade
pessoa lendo um jornal
Trabalho compilou textos literários e exemplares de jornais populares, além dos que são produzidos por moradores de rua e operários - Foto: JC Oliveira/Flickr - CC by NC ND 2.0

De acordo com dados coletados em uma ação coletiva entre a Ação Educativa e o Instituto Paulo Montenegro em 2016 sobre o Indicador de Alfabetismo Funcional (Inaf), apenas 8% dos brasileiros possuem letramento pleno. Diferentemente da alfabetização, o letramento refere-se ao uso competente da leitura e da escrita nas práticas sociais. 42% dos brasileiros encontram-se no nível elementar de letramento, sendo capazes de realizar operações básicas e trabalhar com textos de extensão média, efetuando pequenas inferências. Enquanto conseguem ler textos mais complexos e entender as palavras por si sós, nem sempre conseguirão compreendê-las completamente e alcançar o sentido do que está sendo dito. Com isso em mente, Bianca Franco Pasqualini desenvolveu o CorPop, uma representação da língua portuguesa que a maior parte da população fala e utiliza atualmente e que muitas vezes é ignorada.

Compilado a partir de textos que fossem facilmente entendidos e alguns também produzidos por pessoas de nível de letramento médio, o CorPop diferencia-se de outras coletâneas organizadas anteriormente pelo tipo de materiais que foram escolhidos para a sua composição. Além de servir como registro histórico para gerações futuras, ele também pode servir como parâmetro de simplicidade textual para melhor se comunicar com o cidadão médio. De acordo com ela, a ideia era fazer um corpus do português popular escrito, fugindo do jornalismo tradicional, que é um registro da língua utilizada por uma minoria da nossa população. “A maioria dos brasileiros têm letramento médio ou baixo, e queríamos um corpus que refletisse isso, que esse brasileiro médio entendesse e em que ele estivesse representado como produtor de texto”, diz ela.

Um corpus pode ser qualquer apanhado de textos que tenham alguma característica em comum. Embora possa ser limitado em sua constituição, o CorPop é representativo do público médio brasileiro, dos leitores de classe C e D, que são a maior parte da população brasileira. Contando com textos literários e exemplares de jornais populares, além dos que são produzidos por moradores de rua e operários, a coleção pode sempre ser ampliada com mais textos e maior variedade, desde que se encaixem nas características que definem esse corpus. Determinado o perfil do público-alvo com o qual estaria trabalhando, Bianca utilizou jornais como Diário Gaúcho, Massa e Hora Central de Santa Catarina, entre outros materiais. Para representar o leitor médio como produtor de conteúdo, escolheu os jornais Boca de Rua e Diário da Causa Operária e, não se prendendo somente aos textos jornalísticos, também selecionou exemplares de livros da coleção Neoleitores, que adapta e simplifica clássicos da literatura. Como padrão, todos os textos escolhidos refletem uma linguagem que o brasileiro médio consegue entender.

Mais que um simples registro dessa língua média, o CorPop também possui outros usos possíveis. Sendo tanto um método de análise e simplificação como também uma ferramenta para auxiliar na construção de textos simples, pode ser um material de apoio para pessoas da área de linguística com diversas finalidades. Embora o corpus possa ter utilidades paralelas, o principal objetivo de Bianca era justamente fazer o registro dessa língua. “É um registro de como fala o povo brasileiro ainda dentro da norma culta. Existe uma norma culta invisível que é falada pelo povo, e isso não fica registrado. É a língua que a maioria do povo brasileiro entende”, afirma a pesquisadora. O CorPop é uma ótima ferramenta para analisar se textos serão compreendidos ou não pela maior parte da população e para se aprender a escrever para pessoas com apenas ensino médio, auxiliando nas escolhas lexicais e sintáticas mais apropriadas para o público com escolaridade baixa.

Após receber críticas de que estaria tentando limitar a língua portuguesa por baixo, Bianca afirma que essa nunca foi a sua intenção. “Ele pode servir como um parâmetro, não como limitação. Só quero mostrar que essa língua precisa ser registrada. Se quisermos avançar no aprofundamento do ensino da língua, temos que partir da realidade”, ela aponta. Para a pesquisadora, deve haver um esforço para que o texto seja entendido, algo que ela acredita que não acontece atualmente. Para ela, o edital do Enem é um antiexemplo de como escrever para pessoas com apenas ensino médio, justamente o público que está realizando a prova. “Eu vejo uma necessidade de humilhar esse cidadão, fazer com que não entenda mesmo”, continua. Bianca diz que é preciso melhorar os níveis de letramento no Brasil, mas que, para isso, é preciso alfabetizar esses cidadãos primeiro, de modo que possamos aumentar as taxas de letramento pleno e combater a desinformação. Ainda em fase de desenvolvimento, o CorPop conta com um website e ferramentas de pesquisa para quem deseja utilizá-lo em seus trabalhos. No futuro, ainda pretendem adicionar mais ferramentas e mais textos ao corpus. “Ele é aberto, e a ideia é que continue crescendo”, conta Bianca.

 

Tese

Título: Corpop: um corpus de referência do português popular escrito do Brasil
Autora: 
Bianca Franco Pasqualini
Orientadora: 
Maria José Bocorny Finatto
Unidade: 
Programa de Pós-Graduação em Letras