Propositions de Normalisation pour une Base de Corpus Multimedia à l'ED268
Publications autour du projet
Rapport Final Projet PIED268, Mars 2006, Cédric Gendrot, Serge Fleury.
Présentation du projet Mars 2006, Cédric Gendrot, Serge Fleury, Michel Jacobson, Assises de la Recherche, Université Sorbonne Nouvelle (Paris 3), 2 et 3 mars 2006 - Paris.
Présentation du projet Septembre 2005, Bénard Frédérique
Normalisation de corpus oraux : des métadonnées à l'annotation de transcriptions, Maîtrise Sciences du Langage mention "Industries de la Langue", ILPGA, Université Paris 3, Sorbonne Nouvelle, Bénard Frédérique, soutenue le 21/09/2005.
Présentation du projet à mi-parcours, faite au cours des RJC-ED268 (Rencontre Jeunes Chercheurs ED268), faite le 21.05.2004
Résumé Soumission RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.
Article complet RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.
Transparents de Présentation du projet, 10.09.2004
Opérations prévues
Sont prévus :
En 2004
Pré-rapport "Etat de l'art"
§ Ce
pré-rapport tentera de faire un point complet sur les projets passés, en cours
ou à venir menés autour des problématiques voisines à celle de ce projet :
codage de corpus de langue, normalisation et mise à disposition pour la
communauté universitaire
Mise en place du lieu de stockage (provisoire) commun des données du
projet
§ Avant
de disposer d'une structure du type serveur, les données seront regroupées dans
un lieu commun (elles seront aussi dupliquées dans un autre lieu afin de
disposer d'une sauvegarde "miroir", cette duplication sera d'ailleurs
faite régulièrement). Cette étape conduira à une mise en commun immédiate des
ressources actuellement disponibles afin de rendre visible dès le démarrage du
projet la diversité des ressources de l’ED268.
Constitution d'une batterie de corpus de test
§ Avant
de disposer de données expérimentales couvrant l'ensemble des types de données
possibles, on tentera de constituer un "panel" représentatif des
données potentiellement disponibles pour ce projet. Ce panel de données sera le
point de départ pour la réflexion autour de la définition des propositions de
recommandation pour le codage des données.
En 2005
Mise en place du serveur avec base de données (minimale) :
§ Cette
étape tentera de mettre en place une première plateforme intégrant la
configuration du serveur et l'intégration d'une première maquette pour la base
de données et pour l'interface permettant le mécanisme d'interrogation de la
base.
En 2006
Ouverture du serveur avec base de données (minimale) complète
Rapport final intégrant :
§ Proposition
de recommandation pour le codage des corpus de langue
o
avec résultats d'expérimentation sur une batterie de
corpus de test
§ Prototype
de plateforme avec bases de données de corpus de langue
o
intégrant la batterie de corpus de test
Une journée d'étude
§ Présentation
du projet et intervention sur des projets concurrents