CRDO : Centre de Ressources pour la Description de l'ORAL

Le Centre de Ressources sur la Description de l'Oral (CRDO) est le Centre de Ressources Numériques centré sur les ressources orales. Il a été composé à partir de deux propositions portées respectivement par les deux laboratoires Lacito et LPL. Le groupe parisien du CRDO correspond à la proposition portée par le Lacito et à laquelle sont associés différents laboratoires de la région parisienne. Le SYLED/CLA2T (ED268) et le LPP (ED268) sont 2 des membres parisiens du CRDO. Les données développées dans le cadre du projet associé à ce site seront intégrées au cours de l'année 2006/2007 au CRDO.

Propositions de Normalisation pour une Base de Corpus Multimedia à l'ED268

Le catalogue de métadonnées du PIED268 : Vidéo - Mode d'emploi


Les deux vidéos suivantes présentent le mode d'emploi du moteur de recherche dans le corpus :
Vidéo n°1 : format AVI, 7.6 Mo (si vous n'arrivez pas à lire directement ce fichier dans votre navigateur, procédez comme suit : clic-droit -> enregistrer sous -> lecture via VLC : http://www.videolan.org/vlc/)
Vidéo n°2 : format AVI, 22.1 Mo (via Internet Explorer/Windows Media Playerou après installation du codec suivant TechSmith Screen Capture Codec (TSCC))

 

Objectifs du projet

L'objectif de ce projet est de proposer une réflexion et une démarche pour constituer des ressources linguistiques normalisées (données orales, écrites et vidéo) dans un cadre pluridisciplinaire. Sont en effet apparues ces dernières années de nombreuses tentatives internationales visant à normaliser les ressources électroniques (pour les sciences humaines en particulier (cf TEI, CES) ou plus généralement pour la diffusion des informations sur le web (projet web sémantique, W3C). Le projet vise à s'inscrire dans cette perspective de constitution de ressources électroniques normalisées dans le cadre des corpus de langue. Il s'attache à définir des perspectives de structuration de corpus en intégrant des marqueurs de strate dans les textes encodés pour donner à voir les textes sous ces différents facettes en parcourant en profondeur les strates définies.

Présentation du projet Septembre 2005, Bénard Frédérique

Normalisation de corpus oraux : des métadonnées à l'annotation de transcriptions, Maîtrise Sciences du Langage mention "Industries de la Langue", ILPGA, Université Paris 3, Sorbonne Nouvelle, Bénard Frédérique, soutenue le 21/09/2005.

Présentation du projet à mi-parcours, faite au cours des RJC-ED268 (Rencontre Jeunes Chercheurs ED268), faite le 21.05.2004

Résumé Soumission RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.

Article complet RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.

Transparents de Présentation du projet, 10.09.2004

 

Actualités

Dans le cadre de la Journée d’étude : “Constitution, exploitation, diffusion et conservation des corpus oraux”, Mardi 17 mai 2005, BnF
URL : http://www.culture.gouv.fr/culture/dglf/corpus_oraux.htm
Publication d’un “Guide des bonnes pratiques pour la constitution, l’exploitation, la diffusion et la conservation des corpus oraux” (PDF, 1 344 Ko), Délégation générale à la langue française et aux langues de France, Mai 2005.