INDÚSTRIAS DA LÍNGUA

 

Projecto
Léxico Multifuncional Computorizado do Português Contemporâneo

Desenvolvido pelo Centro de Linguística da Universidade de Lisboa com a participação do Instituto de Engenharia de Sistemas e Computadores (INESC) e da Editorial Verbo, com o apoio do Istituto di Linguistica Computazionale (ILC) del Centro Nazionale della Ricerca (CNR) de Pisa, Itália.

O projecto Léxico Multifuncional Computorizado do Português Contemporâneo, iniciado em 13 de Maio de 1997 e concluído em 13 de Maio de 2000, desenvolveu-se no âmbito do Programa Praxis lançado pela Fundação para a Ciência e a Tecnologia (FCT),

O português europeu conta agora com um Léxico de Frequências de 26.474 vocábulos, e das 140.312 formas lematizadas desses vocábulos, extraído de um corpus muito significativo (16.210.438 palavras) do português contemporâneo; as entradas lexicais que o constituem atingiram, no corpus, frequências iguais ou superiores a 6. Cada entrada lexical (vocábulo) é seguida de informação gramatical (categoria morfossintáctica) e de informação quantitativa (nível de ocorrência no corpus). As mesmas informações são dadas para todas as formas lexicais (formas flexionadas e alguns compostos) de cada vocábulo. As indexações do léxico são feitas por ordem alfabética e por ordem de frequências decrescentes.

Equipa de investigação: Maria Fernanda Bacelar do Nascimento, coordenadora científica, pelos investigadores João Malaca Casteleiro e Maria Lúcia Garcia Marqueset e as bolseiras Flobela Barreto e Raquel Amaro.

Informações: Sector de Investigação, Centro de Linguistica, Universidade de Lisboa, Av. Prof. Gama Pinto 2, 1649-003 Lisboa, Portugal. Tel.: (351.21) 790.47.00/795.07.90. Fax: (351.21) 796.56.22. C. el.: clul@clul.ul.pt. Internet: www.clul.ful.pt/sectores/projecto_lmcpc.html.