EM DIRETO DA TERMILAT

Aqui está uma seleção de mensagens proveniente da lista moderada de discussão sobre a terminologia e as indústrias da língua —criada por iniciativa da DTIL— e que tem um interesse particular para nossos leitores.

<ENV 828>
De 30 de outubro ao 3 de novembro de 2000, a direção do Departamento de Informações Científicas e Técnicas da Universidade de La Habana organiza o 5º Taller de Bibliotecas Universitarias de América Latina y el Caribe. O tema sobre a tradução nos serviços de informação será abordado. Informações com: vtaller@dict.uh.cu, ranero@dict.uh.cu, .
Idania Suárez López Gavilán, Esp. Principal Grupo de Traducciones, Universidad de La Habana. C. el.: idania@dict.uh.cu.

<ENV 849>
O co-listeiro Hubert Joly, secretário-geral do Conseil international de la langue française (Cilf), uma instituição de prestígio, especialmente devido ao seu trabalho terminológico, enviou-nos o comunicado redigido após o encontro que teve lugar em 2 de junho de 2000, na propriedade de la Bûcherie (Saint-Cyr en Anhies, França), entre a Gesellschaft für deutsche Sprache (Sociedade para a língua alemã, com sede em Wiesbaden, subvencionada pelo governo Federal da Alemanha e os Länder) e o Cilf, sobre o tema "Le français et l'allemand contre le tout anglais en Europe". […] as duas instituições decidiram unir seus esforços para evitar que a língua inglesa se torne, de fato, a única língua de comunicação nas instâncias da União Européia, ou a língua principal dos serviços lingüísticos da União em Luxemburgo. Claro que convém também cuidar para que os próprios franceses e os alemães apliquem a si mesmos esta regra e se esforcem em dialogar nas duas línguas, o que pressupõe um mínimo de conhecimento passivo da outra língua. […].
Hubert Joly, Secretário Geral do Conseil international de la langue française, 11 rue de Navarin, 75009 Paris, França. C. el.: cilf@cilf.org. Endereço web: www.cilf.org/

<ENV 850>
O projecto "Processamento computacional do português" é uma iniciativa concreta do Ministério da Ciência e Tecnologia português, inserida no objectivo geral de melhorar significativamente a comunicação homem-máquina e a comunicação humana com o auxílio do computador, em português, e facilitar o acesso, em língua portuguesa, à cada vez mais vasta informação em formato electrónico.
A nossa actividade tem-se centrado em duas vertentes principais:
- Catalogação do que existe na área do processamento computacional da língua portuguesa, mantendo um catálogo de recursos bem como de ligações a outros grupos com trabalho na área. Compilamos também uma lista de publicações sobre o assunto, fornecendo a possibilidade de disponibilizar artigos ou teses a partir do nosso servidor. Recentemente, criamos também um sistema de busca na Web sobre esta área.
- Criação e disponibilização de recursos para a I&D na área. Implementamos um serviço de acesso a corpora de português - a possibilidade de procurar aprox. 50 milhões de palavras, em alguns casos já analisadas e anotadas com a sua categoria gramatical e função sintáctica. Encontram-se, também, em progresso, subprojectos para criar outros corpora de utilidade para a comunidade científica da área.
Outras actividades no âmbito do nosso projecto são a avaliação do que existe (veja-se a recente comparação de 16 recursos que conjugam verbos em português), assim como a disseminação de informação de interesse para a comunidade num fórum que mantemos para o efeito. Finalmente, o ano passado fomos encarregados de criar um documento para debate público, de que publicámos o relato, assim como as intervenções dos panelistas.
Toda essa informação se encontra disponível de www.portugues.mct.pt/ (...). Agradecemos pois encarecidamente a todos os que nos possam apontar recursos terminológicos que ainda não tenhamos catalogado.
Diana Santos et Paulo Rocha, Processamento computacional do português, Sintef Telecom and Informatics, Box 124 Blindern, 0314 Oslo, Noruega. Fax: (47) 22.06.73.50. C. el.: projecto@informatics.sintef.no. Endereço web: www.portugues.mct.pt

<ENV 869>
Temos o prazer de anunciar a disponibilidade de novos recursos na Elra, Association européenne pour les ressources linguistiques (Associação européia para recursos lingüísticos) cuja descrição apresentamos a seguir:
Elra-W0024 Corpus Parole portugais
O corpus Parole do português contém cerca de três milhões de palavras correntes do português europeu reagrupadas segundo o tipo de suporte: jornais, cerca de 65%, tirados de três títulos que cobrem o período 1996-1997; obras, cerca de 20%, tiradas de 12 títulos de três editoras diferentes; periódicos, cerca de 5%, tirados de sete números de uma revista semanal, 1996; diversos, cerca de 10%, provenientes de sete ficheiros fornecidos por oito títulos. O corpus foi classificado e anotado de acordo com o núcleo comum do padrão de codificação Parole. Ele é apresentado em formato SGML. Um sub-conjunto do corpus Parole do português retoma o esquema de distribuição por suporte (jornais: cerca de 65%; obras: cerca de 20%; periódicos: cerca de 5%; diversos: cerca de 10%). Ele contém 250.000 palavras rotuladas em nível morfo-sintaxico de acordo com os padrões de rotulação e anotação morfo-sintaxicos Parole. A não ambiguidade foi verificada manualmente. Os ficheiros são apresentados em formato SGML.
Elra-L0035 Lexique Parole portugais
O léxico Parole do português é composto de 20.000 entradas codificadas, tanto em nível sintáxico quanto morfo-sintaxico, segundo as especificações Parole. Os dados são apresentados em formato SGML.
Informações:
Elra/Elda, 55-57 rue Brillat-Savarin, 75013 Paris, França. Tel.: (33.1) 43.13.33.33. Fax: (33.1) 43.13.33.30. C. el.: mapelli@elda.fr Endereço web: www.elda.fr