SEAD

Secretaria de Educação a Distância
Edital UFRGS EAD 11

UFRGS
 

Professor Proponente Maria José Bocorny Finatto
Unidade Instituto de Letras
Ramal 6760
E-mail mfinatto@terra.com.br
Telefone 98054036
Site www.ufrgs.br/textquim
Já teve projeto contemplado em algum Edital? Sim , nos editais 05, 07, 09
URL 1 www.ufrgs.br/textquim
Enviado 18/03/2009 às 02h 18min
Senha 9b29039cffe69a594d25cf466bf3ae5be538aed4
Título do Projeto PERFIS DO PORTUGUÊS POPULAR ESCRITO PARA UM AMBIENTE DE EAD: PADRÕES DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS PARA O ENSINO DE LÍNGUA PORTUGUESA
Linha B

Equipe de Trabalho
NomeFunção
Maria José B. FinattoCOORDENADOR
Tadeu BisogninCOLABORADOR, DOCENTE DO COLÉGIO DE APLICAÇÃO UFRGS
Valdir do Nascimento FloresPESQUISADOR, DOCENTE INST. DE LETRAS
Carmem Luci da Costa SilvaPESQUISADOR, DOCENTE DO INST. DE LETRAS
Aline VillavicencioCOLABORADOR, INST. DE INFORMÁTICA DA UFRGS
Bruna Rodrigues da SilvaCOLABORADORA, ESTUDANTE DE LICENCIATURA EM LETRAS, MONITORA SEAD DA DISCIPLINA LÉXICO E DICIONÁRIOS
Kleber V. SchenkCOLABORADOR, INSTRUTOR DE PORTUGUÊS PARA ESTRANGEIROS DO PPE, PROGRAMA DE PORTUGUÊS PARA ESTRANGEIROS DA UFRGS

Atividades(s) de ensino à(aos) qual(is) o projeto está vinculado
CódigoAtividadeResponsavelCurso
LET01428Léxico e DicionáriosMaria José Bocorny FinattoLetras Licenciatura e Bacharelado em tradução
LET01433Morfologia e SintaxeValdir do Nascimento FloresLetras, licenciatura
LET01436Estudos do textoCarmem Luci da Costa SilvaLetras, licenciatura
LET 01424Teoria do textoMaria José B. FinattoLetras, bcharelado em tradução
INF5005Tópicos Especiais em Computação IV: Introdução ao Processamento da Linguagem NaturalAline VillavicencioBacharelado em Ciencia da Computacao
LET01432Visão Crítica da GramáticaValdir do Nascimento FloresLetras, licenciatura
XXXXComunicação e Expressão/Língua PortuguesaTadeu BisogninColégio de Aplicação da UFRGS, Ensino Médio

Descrição do Projeto
Este projeto prevê a integração de uma pesquisa básica sobre padrões de linguagem e de texto em língua portuguesa e de uma pesquisa sobre sua transposição aplicada a um ambiente virtual de aprendizagem para uso em Educação a Distância. O Projeto, assim imbuído, envolve descrição e estudo de padrões do vocabulário exibido por textos de jornais populares brasileiros voltados para públicos de menor poder aquisitivo com vistas à produção de ambiente virtual de aprendizagem dirigido para o ensino de língua portuguesa e para a formação de professores de língua portuguesa. A partir da descrição empreendida, o ambiente será planejado e implemantado em formato experimental, em site hospedado em servidor da UFRGS, sendo seus usuários estudantes de licenciatura em Letras da UFRGS e estudantes da disciplina de língua portuguesa do Colégio de Aplicação da UFRGS. Nesta etapa da pesquisa (fase1- com 12 meses), será considerado como fonte dados para a descrição apenas o jornal popular Diário Gaúcho (doravante DG), publicado em Porto Alegre-RS, produzido pelo grupo RBS. A pesquisadora proponente já conta com um corpus de 12 meses do referido jornal, em formato digital, com a devida autorização de uso do material textual dada pelo jornal. Esse jornal foi escolhido a partir de um conjunto de jornais brasileiros do gênero em função de sua enorme tiragem (164 mil exemplares/dia) e de sua grande aceitação por parte do público a que se destina.

Objetivos
O PRIMEIRO OBJETIVO PRINCIPAL é a obtenção de uma caracterização do vocabulário e da feição da linguagem tal como exibidos em textos jornalísticos que foram feitos, em tese, de um modo mais simplificado, para atender uma determinada faixa de leitores. Associado a esse objetivo, há também UM SEGUNDO OBJETIVO PRINCIPAL que é o o de produzir um aproveitamento didático para a descrição obtida em um ambiente virtual de aprendizagem. Essa simplificação do texto do DG, também em tese, estaria a serviço de uma facilitação de compreensão de leitura para pessoas de um determinado grupo social e econômico, com uma bagagem cultural mais ou menos tipificada e graus de escolaridade relativamente baixos. A caracterização a ser empreendida privilegiará a observação estatística de freqüências, de distribuição de palavras e de suas associações mais recorrentes em relação ao que se observa em textos consumidos por públicos de maior poder aquisitivo. Os produtos mais imediatos da pesquisa, ao final do seu primeiro ano, serão: a) o desenho de um objeto de aprendizagem em meio on-line para estudo de de padrões de vocabulário; b) um dicionário palavras e de construções mais utilizadas no DG tendo em vista seu aproveitamento para um dicionário básico de português voltados para aprendizes de língua portuguesa como língua estrangeira. Estão previstos, também como produtos, estudos-piloto sobre determinados tipos recursos de ensino em ambientes virtuais, estudos sobre tipos de palavras ou construções, publicação de artigos e apresentação de trabalhos em eventos nos quais são divulgados dados da exploração.

Metodologia
Etapas e metodologia da pesquisa: A primeira tarefa de pesquisa consiste na produção e organização do corpus DG em formato somente texto, o que é feito a partir dos arquivos originais de 12 meses do jornal a nós cedidos em formato PDF. Isso é necessário porque apenas nesse formato de arquivo é possível utilizar sistemas computacionais especialmente desenvolvidos para a realização de diversas estatísticas lexicais, para a produção de representações de conteúdos textuais e para a obtenção de listagens de palavras de diferentes perfis. Os enfoques iniciais da pesquisa serão de cunho estatístico e contarão com o apoio de pesquisadores de Lingüística Computacional/Processamento da Linguagem Natural (PLN) do Instituto de Informática da UFRGS e da Faculdade de Informática (FACIN) da PUC-RS. Esses pesquisadores da área da Computação desenvolvem estudos sobre sistemas de exploração automatizada de corpora, sobre presença e configuração de expressões multipalavra e sobre sistemas automáticos para geração de ontologias a partir de corpora. São também feitas observações e contrastes com padrões de vocabulário do jornal Zero Hora (ZH), publicado pela mesma empresa do Diário Gaúcho, o qual é dirigido a públicos de maior poder aquisitivo. Esse contraste é realizado a partir de textos que são simultaneamente publicados no jornal ZH e no DG, sendo que a versão do texto do DG é, em geral, mais curta. Esse trabalho de contraste é feito em parceria com investigadores de PLN do Núcleo Interinstitucional de Lingüística Computacional da USP (NILC-USP) que já desenvolvem pesquisa relacionada no projeto PorSimples, que estuda a simplificação de textos com vista a atender portadores de dificuldades de leitura. O corpus PorSimples inclui textos do jornal ZH que possuem uma seção “Para seu Filho Ler”, formando assim um corpus paralelo de “textos originais” e “textos adaptados para crianças de 8 a 11 anos”, além de versões simplificadas dos originais destinadas a analfabetos funcionais e, potencialmente, a pessoas com outras deficiências cognitivas, como afasia e dislexia. Também estão previstos outros contrastes com diferentes padrões de vocabulário: textos de revistas de divulgação de temas de ciências para leigos, redações de vestibulandos, textos científicos e textos literários. A segunda tarefa de pesquisa consiste em propor o desenho e a implementação de um ambiente virtual de aprendizagem que se abastece dos dados reunidos na primeira tarefa. Nesta segunda tarefa estão previstos: a) revisão da literatura sobre Objetos de Aprendizagem, sobre recursos em EAD e sobre recursos informatizados para exploração on-line de vocabulários acoplados a bases de textos; b) estudo de ambientes virtuais já disponíveis para uso livre que explorem padrões de vocabulário da língua portuguesa do Brasil; c) produção do desenho do ambiente virtual e testagem com estudantes de português do Colégio de Aplicação da UFRGS e alunos de disciplinas do curso de letras da UFRGS. REFERENCIAIS TEÓRICOS: Dito de um modo, MUITO simplificado, a parte descritiva da pesquisa segue teorias lingüísticas sobre texto e vocabulário em língua portuguesa, especialmente estudos sobre Lexicologia e Lexicografia, com destaques para pesquisas descritivas e não prescritivas sobre usos do português brasileiro. A parte aplicada da pesquisa, dedicada ao planejamento e à implementação de um Ambiente Virtual de Aprendizagem, segue as orientações de perspectivas construtivistas do ensino em geral e do ensino em EAD.

Resultados Esperados
Serão obtidos os seguintes resultados: 1) Uma caracterização ampla do vocabulário e da feição da linguagem tal como exibidos em textos que foram feitos, em tese, de um modo mais simplificado, para atingir leitores de um determinado perfil sócio-ecônomico. Esses textos são representados pelos textos de 12 meses do jornal Diário Gaúcho. 2) Desenho inicial e implementação experimental de um ambiente virtual de aprendizagem voltado para estudo de vocabulário básico ou simplificado do português brasileiro com vistas a aproveitamento em situação de ensino de língua portuguesa. 3) Conjunto de dados para aproveitamento em projetos e pesquisas futuros que envolvam perfis eu característcas vocabulário do português popular escrito, tal como manifestado pelo texto associado ao jornalismo popular. Outros resultados possíveis: a)Corpus DG a ser oferecido on-line, em formato somente texto, devidamente etiquetado e identificado, para ser utilizado por pesquisadores universitários interessados no tema. b)Descrições da configuração do vocabulário manifestado no corpus reunido. c)Listagens contextualizadas de itens e de expressões mais recorrentes do vocabulário do corpus DG. d)Estudos contrastivos com vocabulários de outros corpora. e)Estudos-piloto sobre vocabulário do português popular escrito do Brasil com vistas à produção de dicionários básicos de português de acordo de freqüências de usos. f)Trabalhos para apresentação em eventos científicos das áreas de Lingüística/Letras/Ensino de Língua Portuguesa, de Lingüística de Corpus e de Lingüística Computacional.

Apoio solicitado
Bolsista de Graduação

Descrição do Apoio Solicitado
1) Estudo da bibliografia sobre: a) jornalismo popular brasileiro; b) padrões do vocabulário e produção de dicionários ou outros repertórios destinados ao ensino de língua portuguesa. 2) Reuniões semanais com a coordenadora e professores colaboradores. 3) Familiarização com sites e pesquisa que já oferecem dados sobre o vocabulário do português brasileiro (Projeto Lácio-Web da USP, Banco de Português da PUC-SP, dados do Projeto PorSimples do Núcleo Interinsticuivonal de Lingüística Computacional da USP/UFSCar, Linguateca (Universidade de Lisboa) e site da ACBL no Vocabulário Ortográfico da Língua Portuguesa). 4) Familiarização com a bibliografia sobre ambientes virtuais de aprendizagem e com sites que já oferecem recursos para exploração on-line, pelo usuário, de dados de vocabulário escrito em acervos de textos em português brasileiro. 5) Familiarização com a elaboração de recursos on-line para ambientes virtuais de aprendizagem. 6) Auxílio ao desenho de um Obejto de Aprendizagem abastecido com dados sobre o vocabulário descrito, dirigido tal Objeto a licenciandos em Letras e estudantes do Ensino Médio. 7) Auxílio à implementação experimental de Objeto de Aprendizagem em parceria com estudante de Ciência da Computação que será respons´vael pela implementação do Objeto e das ferramentas necessárias para a exploração do acervo textual do DG.

Recursos Adicionais
Será MUITO importante poder com um segundo bolsista, estudante de Ciência da Computação, já familiarizado com os temas da disciplina Tópicos Especiais em Computação IV: Introdução ao Processamento da Linguagem Natural e com os recursos de PHP para a produção de estatístcas de vocabulário, visto que ele fará a implemenatação experimental do Objeto de Aprendizagem. Alguns desses recursos pra exploração on-line de vocabulário em textos já foram desenvolvidos e estão à disposição no site TExTQUIM, mas necessitam de uma adaptação, dado que os textos-fonte agora são outros e não são textos técnicos em diferentes línguas. Caso seja não possível contar com esse segundo bolsista durante os 12 meses do Projeto, tê-lo pelo menos nos 6 meses finais do trabalho seria uma condição boa.

Comentários
Não há ainda estudos sistemáticos sobre padrões de vocabulário exibidos por jornais populares, o que sinaliza um inovação em msio aos estudos da linguagem e de língua portuguesa. Além disso, a coordenadora/proponente é pesquisdora CNPq e já tem experiência em estudos de vocabulário com apoio informatizado nas interfaces com produtos e pesquisas de Lingüística Computacional e estudos da Tradução de línguas estrangerias para o português e vice-versa. Essa experiência pode ser conferida no seu CV Lattes e nos recursos já em funcionamento no site www.ufrgs.br/textquim. A parceria com docentes do setor de língua portuguesa do Depto. de Letras Clássicas e Vernáculas da UFRGS, do CAP da UFRGS e do Inst. de Informática é também será fator importante para o bom cumprimento do que aqui está proposto.

Item(ns) Contemplado(s)
1 Bolsista de Graduação