Corpus ANCOR Centre

ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is...

Full description

Bibliographic Details
Main Author: Antoine, Jean-Yves Pr, LI
Other Authors: Boyer-Pelletier, Aurore Ms, LLL (annotator), Muzerelle, Judith Ms, LLL (annotator), Desoyer, Adèle Ms, LATTICE (developer), Lefeuvre, Anaïs Dr, LI (researcher), Schang, Emmanuel Dr, LLL (researcher), Tellier, Isabelle Pr, LATTICE (researcher), Landragin, Frederic Dr, LATTICE (researcher), Eskhol, Iris Dr, LLL (researcher), Maurel, Denis Pr, LI (researcher), Villaneau, Jeanne Dr, IRISA (researcher), Antoine, Jean-Yves Pr, LI (depositor), Laboratoire d'Informatique (LI, Tours FR) (publisher), Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher)
Format: Dataset
Language:French
Published: Laboratoire d'Informatique (LI, Tours FR) 2014
Subjects:
Online Access:http://hdl.handle.net/11041/ortolang-000903
http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc
http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf
http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html
http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml
http://hdl.handle.net/11041/ortolang-000903/olac.xml
http://hdl.handle.net/11041/ortolang-000903/rdf.html
http://sldr.org/logo/LogoOrtolang_small.png
Description
Summary:ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution. MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. http://hal.archives-ouvertes.fr/hal-01075679 Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562]. http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf https://hal.archives-ouvertes.fr/hal-01016562