Propositions de Normalisation pour une Base de Corpus Multimedia à l'ED268

Publications autour du projet

Rapport Final Projet PIED268, Mars 2006, Cédric Gendrot, Serge Fleury.

Présentation du projet Mars 2006, Cédric Gendrot, Serge Fleury, Michel Jacobson, Assises de la Recherche, Université Sorbonne Nouvelle (Paris 3), 2 et 3 mars 2006 - Paris.

Présentation du projet Septembre 2005, Bénard Frédérique

Normalisation de corpus oraux : des métadonnées à l'annotation de transcriptions, Maîtrise Sciences du Langage mention "Industries de la Langue", ILPGA, Université Paris 3, Sorbonne Nouvelle, Bénard Frédérique, soutenue le 21/09/2005.

Présentation du projet à mi-parcours, faite au cours des RJC-ED268 (Rencontre Jeunes Chercheurs ED268), faite le 21.05.2004

Résumé Soumission RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.

Article complet RJC-ED268, "Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268", Bénard Frédérique, Gendrot Cédric, 2005.

Transparents de Présentation du projet, 10.09.2004

Opérations prévues

Sont prévus :

En 2004

Pré-rapport "Etat de l'art"

§       Ce pré-rapport tentera de faire un point complet sur les projets passés, en cours ou à venir menés autour des problématiques voisines à celle de ce projet : codage de corpus de langue, normalisation et mise à disposition pour la communauté universitaire

Mise en place du lieu de stockage (provisoire) commun des données du projet

§       Avant de disposer d'une structure du type serveur, les données seront regroupées dans un lieu commun (elles seront aussi dupliquées dans un autre lieu afin de disposer d'une sauvegarde "miroir", cette duplication sera d'ailleurs faite régulièrement). Cette étape conduira à une mise en commun immédiate des ressources actuellement disponibles afin de rendre visible dès le démarrage du projet la diversité des ressources de l’ED268.

Constitution d'une batterie de corpus de test

§       Avant de disposer de données expérimentales couvrant l'ensemble des types de données possibles, on tentera de constituer un "panel" représentatif des données potentiellement disponibles pour ce projet. Ce panel de données sera le point de départ pour la réflexion autour de la définition des propositions de recommandation pour le codage des données.

En 2005

Mise en place du serveur avec base de données (minimale) :

§       Cette étape tentera de mettre en place une première plateforme intégrant la configuration du serveur et l'intégration d'une première maquette pour la base de données et pour l'interface permettant le mécanisme d'interrogation de la base.

En 2006

Ouverture du serveur avec base de données (minimale) complète

Rapport final intégrant :

§       Proposition de recommandation pour le codage des corpus de langue

o      avec résultats d'expérimentation sur une batterie de corpus de test

§       Prototype de plateforme avec bases de données de corpus de langue

o      intégrant la batterie de corpus de test

Une journée d'étude

§       Présentation du projet et intervention sur des projets concurrents