<ENV
545>
ARC A3 - EVALUATION DES SYSTEMES DE CONSTRUCTION DE TERMINOLOGIE ET
DE RELATIONS SEMANTIQUES ENTRE TERMES :
APPEL À PARTICIPATION
L'ARC A3 est une Action de recherche concertée financée
par l'AUF (Association des universités francophones, ex-Aupelf-Uref).
Ce projet cherche à "promouvoir l'élaboration de
corpus et de procédures d'évaluation concernant le français,
pour permettre à la recherche de progresser et au domaine de
se doter d'instruments de mesure rendant possible une comparaison
objective des différentes approches". D'autre part, il
vise à favoriser le développement des systèmes
et permettre une meilleure visibilité de l'offre.
La première phase de ce projet (1995-1998) a permis de constituer
une première série de corpus, d'établir des protocoles
de tests et d'effectuer une première campagne de tests.
Le présent appel à participation pour le second cycle
du projet ARC A3 (1999-2000) s'adresse à des équipes
de recherche et à des industriels (qu'ils soient francophones
ou non), disposant de système(s) de construction de terminologie
et/ou de relations sémantiques entre termes traitant au moins
le français. Les 8 systèmes qui ont été
testés lors de la première phase ont différentes
fonctionnalités et fournissent différentes sorties :
termes (ordonnés), réseaux grammaticaux, classes de
termes, graphes sémantiques... L'évaluation a été
essentiellement qualitative, et a été effectuée
par les experts sur la base de l'analyse de l'utilisabilité
de l'information procurée par le système.
Nous avons distingué 3 catégories non disjointes de
systèmes :
1. Systèmes d'extraction de candidats-termes : ils se
fondent sur une analyse syntaxique et statistique ;
2. Systèmes "classifieurs ", c'est-à-dire
construisant des classes de termes qui co-occurrent de manière
régulière dans les textes. Ces systèmes se fondent
soit sur une analyse syntaxique et statistique soit sur des approches
numériques pures ;
3. Systèmes d'extraction de relations sémantiques. Ces
systèmes utilisent une approche statistique ou une approche
linguistique par exploration contextuelle.
Les terminologies ont été évaluées suivant
deux objectifs :
1. indexation ;
2. couverture du domaine.
DEROULEMENT DU SECOND CYCLE (1999-2000)
Aucun financement n'est prévu pour cette participation, mais
le bénéfice pour ces équipes de recherche et
ces industriels sera multiple :
* disposer, dans le cadre du projet, d'un ensemble de corpus de documents,
de questions d'utilisateurs et de réponses "justes",
* bénéficier d'une structure d'échange et de
réflexion grâce à la participation de concepteurs
et d'utilisateurs de systèmes,
* la possibilité d'intégration de systèmes, tirant
avantage de la nature complémentaire des résultats issus
des différents systèmes,
* bénéficier de la visibilité induite par la
participation au projet.
Le corpus est proposé par l'INRA (Institut national de recherche
en agronomie). Il est constitué d'articles dans le domaine
des biotechnologies. Plusieurs "spécialistes" de
l'INRA (documentalistes, indexeurs, terminologues travaillant dans
le domaine) sont prêts à évaluer les résultats.
CALENDRIER
- Septembre 1999
Sélection et notification des candidats externes
Premier corpus d'entraînement sur le corpus de l'INRA et un
autre corpus éventuellement
-Octobre 1999
Corpus étiqueté (avec le logiciel Sylex d'Ingenia)
-Janvier 2000
Première session réelle sur le corpus de l'INRA et un
autre corpus éventuellement
-Avril 2000
Réunion de mise au point : analyse des résultats,
raffinement des mesures
Publication des résultats en "interne"
Mise en place définitive de la méthodologie
-Septembre 2000
Deuxième session réelle et définitive sur le
corpus de l'INRA et un autre corpus éventuellement
-Décembre 2000
Publication des résultats en vue des JST (Journées scientifiques
et techniques, colloque organisé par le réseau Francil
et l'AUF).
________
Pour tout complément d'information, vous pouvez nous contacter
à l'adresse électronique suivante : jouis@univ-lille3.fr.
Christophe
Jouis, jouis@univ-lille3.fr
, IDIST, Équipe organisatrice ARC A3, Université Charles
de Gaulle, Lille 3, BP 149, 59653 Villeneuve d'Ascq,
France.
<ENV
544>
Philippe Rouquet présente, dans la liste francophone de terminologie
tlsfrm@uhb.fr, "L'infoport
du traducteur", une page de liens : www.wipo.int/eng/general/links/bookmark/pr/main.htm,
"que j'ai compilée pour la recherche terminologique sur
Internet. [
] Je l'ai commencée en 1994, diffusée
une première fois en 1998, et je viens de la mettre à
jour."
Philippe Rouquet, philippe.rouquet@wipo.int,
traducteur à l'Ompi*, Genève, Suisse.
Note : l'Ompi, qui inclut dans son site cette page, est l'Organisation
mondiale de la propriété intellectuelle (www.wipo.int/fre/main.htm),
l'une des 16 institutions spécialisées du système
des Nations unies. Elle est "chargée de promouvoir la
protection de la propriété intellectuelle à travers
le monde par la coopération des États et d'assurer l'administration
de divers traités multilatéraux touchant aux aspects
juridiques et administratifs de la propriété intellectuelle".
<ENV
598>
Puntoycoma n° 58 est paru : europa.eu.int/comm/sdt/bulletins/puntoycoma/58/index.htm
Puntoycoma est une publication électronique sur des thèmes
de terminologie espagnole, qui résulte d'une initiative du
groupe de coordination linguistique de langue espagnole et de l'unité
de terminologie du Service de la traduction (SdT) de la Commission
européenne. Elle "veut contribuer à l'existence
d'un courant d'échange d'idées entre les services de
traduction et les autres institutions européennes, des organismes
internationaux et des professionnels de la traduction en général".
(Dans Termilat : <ENV 326>, 9/02/1999, <ENV 394>, 22 /03/1999,
<ENV 438>, 5/05/1999)
<ENV
600>
L'Universidad Antonio de Nebrija de Madrid et la société
espagnole Airtel élaborent actuellement un dictionnaire sur
la téléphonie mobile et recherchent des spécialistes
argentins en terminologie qui désireraient collaborer dans
le traitement des équivalents espagnols d'Argentine.
Si ce message vous intéresse, prière de répondre
à :
Secretaría Administrativa de RITerm, dtil@unilat.org,
Direction terminologie et industries de la langue, Union latine, 131
rue du Bac, 75007 Paris, France. Tél. : (33.1) 45.49.60.60.
Télécopie : (33.1) 45.44.45.97.
________
Note : Sur RITerm : www.iula.upf.es/riterm/ritermes.htm
Sur RITerm dans Termilat : <ENV 293> (22/01/1999), <ENV 538>
(4/08/1999)
<ENV 607>
Les groupes de travail brésilien Termisul (ENV 290, 333, 379,
416 et 509, www.ufgrs.br/termisul)
et argentin Termtex ont constitué un groupe de recherche et
d'enseignement bilatéral dans le domaine de la terminologie.
Leurs responsables nous font parvenir une communication (en ES) sur
leurs activités de coopération qui n'a pas pu étre
présentée lors des dernières Jornadas Iberoamericanas
de Terminología de Bogotá.
<ENV
614>
Le Réseau international de néologie et de terminologie*
est heureux d'annoncer que sa revue Terminologies nouvelles
est maintenant accessible sur Internet en format PDF à l'adresse
suivante : www.cfwb.be/franca/termin/liste.htm
On peut également s'y abonner gratuitement au format imprimé
en s'adressant à l'adresse ci-dessous.
Le numéro 19 de Terminologies nouvelles, qui porte sur
le thème "Terminologie et intelligence artificielle",
vient de paraître. Il est constitué des actes du colloque
TIA 99 qui s'est tenu à Nantes en mai 1999**.
Le prochain numéro, qui paraîtra fin décembre
1999, a pour titre "De nouveaux outils pour la néologie".
Il porte essentiellement sur les outils et les méthodes d'élaboration
des banques de textes et leur exploitation pour la veille néologique.
Louis-Jean Rousseau, secrétaire général, Réseau
international de néologie et de terminologie (Rint), 200 chemin
Sainte-Foy, 4e étage, Québec (QC) G1R 2L2 Canada. Courriel : lroussea@olf.gouv.qc.ca
Site web : www.rint.org
________
Note : Sur le Rint en Termilat : ENV 108, 144, 169.
Sur TIA (Terminologie et intelligence artificielle) 99 en Termilat :
ENV 216, 282.