EM DIRETO DA TERMILAT
Aqui
está uma seleção de mensagens proveniente da lista moderada de discussão
sobre a terminologia e as indústrias da língua criada por iniciativa
da DTIL e que tem um interesse particular para nossos leitores.
<ENV
828>
De 30 de outubro ao 3 de novembro de 2000, a direção
do Departamento de Informações Científicas e
Técnicas da Universidade de La Habana organiza o 5º Taller
de Bibliotecas Universitarias de América Latina y el Caribe.
O tema sobre a tradução nos serviços de informação
será abordado. Informações com: vtaller@dict.uh.cu,
ranero@dict.uh.cu, .
Idania
Suárez López Gavilán, Esp. Principal Grupo de
Traducciones, Universidad de La Habana. C. el.: idania@dict.uh.cu.
<ENV
849>
O co-listeiro
Hubert Joly, secretário-geral do Conseil international de la
langue française (Cilf), uma instituição de prestígio,
especialmente devido ao seu trabalho terminológico, enviou-nos
o comunicado redigido após o encontro que teve lugar em 2 de
junho de 2000, na propriedade de la Bûcherie (Saint-Cyr en Anhies,
França), entre a Gesellschaft für deutsche Sprache (Sociedade
para a língua alemã, com sede em Wiesbaden, subvencionada
pelo governo Federal da Alemanha e os Länder) e o Cilf, sobre
o tema "Le français et l'allemand contre le tout anglais
en Europe". [
] as duas instituições decidiram
unir seus esforços para evitar que a língua inglesa
se torne, de fato, a única língua de comunicação
nas instâncias da União Européia, ou a língua
principal dos serviços lingüísticos da União
em Luxemburgo. Claro que convém também cuidar para que
os próprios franceses e os alemães apliquem a si mesmos
esta regra e se esforcem em dialogar nas duas línguas, o que
pressupõe um mínimo de conhecimento passivo da outra
língua. [
].
Hubert Joly, Secretário Geral do Conseil
international de la langue française, 11 rue de Navarin, 75009
Paris, França. C. el.: cilf@cilf.org.
Endereço web: www.cilf.org/
<ENV
850>
O projecto "Processamento computacional do português"
é uma iniciativa concreta do Ministério da Ciência
e Tecnologia português, inserida no objectivo geral de melhorar
significativamente a comunicação homem-máquina
e a comunicação humana com o auxílio do computador,
em português, e facilitar o acesso, em língua portuguesa,
à cada vez mais vasta informação em formato electrónico.
A
nossa actividade tem-se centrado em duas vertentes principais:
-
Catalogação do que existe na área do processamento
computacional da língua portuguesa, mantendo um catálogo
de recursos bem como de ligações a outros grupos com
trabalho na área. Compilamos também uma lista de publicações
sobre o assunto, fornecendo a possibilidade de disponibilizar artigos
ou teses a partir do nosso servidor. Recentemente, criamos também
um sistema de busca na Web sobre esta área.
-
Criação e disponibilização de recursos
para a I&D na área. Implementamos um serviço de
acesso a corpora de português - a possibilidade de procurar
aprox. 50 milhões de palavras, em alguns casos já analisadas
e anotadas com a sua categoria gramatical e função sintáctica.
Encontram-se, também, em progresso, subprojectos para criar
outros corpora de utilidade para a comunidade científica da
área.
Outras
actividades no âmbito do nosso projecto são a avaliação
do que existe (veja-se a recente comparação de 16 recursos
que conjugam verbos em português), assim como a disseminação
de informação de interesse para a comunidade num fórum
que mantemos para o efeito. Finalmente, o ano passado fomos encarregados
de criar um documento para debate público, de que publicámos
o relato, assim como as intervenções dos panelistas.
Toda
essa informação se encontra disponível de www.portugues.mct.pt/
(...). Agradecemos pois encarecidamente a todos os que nos possam
apontar recursos terminológicos que ainda não tenhamos
catalogado.
Diana
Santos et Paulo Rocha, Processamento computacional do português,
Sintef Telecom and Informatics, Box 124 Blindern, 0314 Oslo, Noruega.
Fax: (47) 22.06.73.50. C. el.: projecto@informatics.sintef.no.
Endereço web: www.portugues.mct.pt
<ENV
869>
Temos o prazer de anunciar a disponibilidade de novos recursos na
Elra, Association européenne pour les ressources linguistiques
(Associação européia para recursos lingüísticos)
cuja descrição apresentamos a seguir:
Elra-W0024
Corpus Parole portugais
O corpus Parole do português contém cerca de três
milhões de palavras correntes do português europeu reagrupadas
segundo o tipo de suporte: jornais, cerca de 65%, tirados de três
títulos que cobrem o período 1996-1997; obras, cerca
de 20%, tiradas de 12 títulos de três editoras diferentes;
periódicos, cerca de 5%, tirados de sete números de
uma revista semanal, 1996; diversos, cerca de 10%, provenientes de
sete ficheiros fornecidos por oito títulos. O corpus foi classificado
e anotado de acordo com o núcleo comum do padrão de
codificação Parole. Ele é apresentado em formato
SGML. Um sub-conjunto do corpus Parole do português retoma o
esquema de distribuição por suporte (jornais: cerca
de 65%; obras: cerca de 20%; periódicos: cerca de 5%; diversos:
cerca de 10%). Ele contém 250.000 palavras rotuladas em nível
morfo-sintaxico de acordo com os padrões de rotulação
e anotação morfo-sintaxicos Parole. A não ambiguidade
foi verificada manualmente. Os ficheiros são apresentados em
formato SGML.
Elra-L0035 Lexique Parole portugais
O léxico Parole do português é composto de 20.000
entradas codificadas, tanto em nível sintáxico quanto
morfo-sintaxico, segundo as especificações Parole. Os
dados são apresentados em formato SGML.
Informações: Elra/Elda,
55-57 rue Brillat-Savarin, 75013 Paris, França. Tel.: (33.1) 43.13.33.33.
Fax: (33.1) 43.13.33.30. C. el.: mapelli@elda.fr
Endereço web: www.elda.fr