Ce numéro a été réalisé
avec le soutien
de la Délégation générale
à la langue française (DGLF)

 


INDUSTRIES DE LA LANGUE

 

projet européen

(Integrated Reference Corpora for Spoken Romance Languages)


L'objectif du projet C-Oral-Rom est de créer des matériels multimédia multilingues destinés à faciliter l'étude du langage parlé spontané et familier. Ces matériels consisteront principalement en un ensemble de corpus oraux en quatre langues latines (espagnol, français, italien et portugais) et un ensemble d'outils informatiques consacrés à la consultation et à l'étude des corpus multilingues. Le produit final sera diffusé sur support DVD (Digital Versatile Disk) et s'adressera à différents types d'utilisateurs :

  • experts en technologies du langage parlé,
  • enseignants en langues L2,
  • orthophonistes et ré-éducateurs,
  • enseignants et éducateurs versés dans les nouvelles technologies,
  • linguistes,
  • traducteurs, etc.

Le projet C-Oral-Rom répond à deux préoccupations principales. Tout d'abord, il se propose de souligner l'importance stratégique que revêtent les ressources en matière de langage parlé pour le développement de la société de l'information et les technologies du langage humain. Le langage parlé spontané et familier est le principal support de la communication humaine, et cependant on commence à peine à développer des ressources technologiques adaptées à ce type de langage. Ensuite, les ressources disponibles en matière de langage parlé sur les langues romanes sont à ce jour extrêmement pauvres, ce qui n'est pas le cas de l'anglais et des langues germaniques. Le projet se propose de combler cette lacune.

PRINCIPAUX OBJECTIFS

  • La création d'un ensemble d'outils et de ressources linguistiques (tant orales que textuelles) multilingues pour quatre langues romanes : l'espagnol, le français, le portugais et l'italien.
  • L'établissement de critères de comparaison entre les corpus oraux et textuels dans ces quatre langues.
  • La proposition de normes et processus de normalisation des corpus multilingues.
  • L'accès à des corpus oraux de langage parlé spontané et familier en vue de leur consultation, étude et validation.
  • La proposition de l'exploitation (à des fins d'enseignement et de recherche) des outils et ressources linguistiques, basée sur l'expérience et les recommandations d'utilisateurs experts comme des chercheurs, linguistes, professeurs en L2, etc.

La durée totale du projet est de 3 ans. Lancé le 1er janvier 2001, il doit donc s'achever le 1er janvier 2004.

C-Oral-Rom est un projet européen inscrit dans le cadre de l'action III "Contenus et outils multimédia" du programme Technologies pour la société de l'information (IST) de la Direction générale de la société de l'information (INFSO) de l'Union européenne.

PARTICIPANTS

Coordinateur du projet :
Università degli studi di Firenze
(Italie)

Pitch Instruments France (France)
Editions Honoré Champion (France)
Agence européenne pour la distribution des ressources linguistiques ELDA (France)
Istituto Trentino di Cultura-ITC-IRST (Italie)
Université de Provence, équipe Delic (France)
Fondação da Universidade de Lisboa (Portugal)
Universidad Autónoma de Madrid (Espagne)
Oficina del Español en la Sociedad de la Información (OESI), Instituto Cervantes.

Université de Provence, Équipe Delic, 29, Avenue Robert Schuman, 13621 Aix-en-Provence Cedex 1, France. Tél: (33.4) 42.95.31.37. Télécopie : (33.4) 42.95.34.95. Courriel : Jean.Veronis@up.univ-mrs.fr.