Corpus ANCOR Centre
ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is...
Main Author: | |
---|---|
Other Authors: | , , , , , , , , , , , , , |
Format: | Dataset |
Language: | French |
Published: |
Laboratoire d'Informatique (LI, Tours FR)
2014
|
Subjects: | |
Online Access: | http://hdl.handle.net/11041/ortolang-000903 http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml http://hdl.handle.net/11041/ortolang-000903/olac.xml http://hdl.handle.net/11041/ortolang-000903/rdf.html http://sldr.org/logo/LogoOrtolang_small.png |
id |
ftsldr:oai:sldr.org:ortolang-000903 |
---|---|
record_format |
openpolar |
institution |
Open Polar |
collection |
Speech and Language Data Repository (SLDR/ORTOLANG) |
op_collection_id |
ftsldr |
language |
French |
topic |
linguistic field: computational_linguistics linguistic field: text_and_corpus_linguistics linguistic field: general_linguistics coreference anaphora conversational speech coréférence anaphore parole spontanée |
spellingShingle |
linguistic field: computational_linguistics linguistic field: text_and_corpus_linguistics linguistic field: general_linguistics coreference anaphora conversational speech coréférence anaphore parole spontanée Antoine, Jean-Yves Pr, LI Corpus ANCOR Centre |
topic_facet |
linguistic field: computational_linguistics linguistic field: text_and_corpus_linguistics linguistic field: general_linguistics coreference anaphora conversational speech coréférence anaphore parole spontanée |
description |
ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution. MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. http://hal.archives-ouvertes.fr/hal-01075679 Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562]. http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf https://hal.archives-ouvertes.fr/hal-01016562 |
author2 |
Boyer-Pelletier, Aurore Ms, LLL (annotator) Muzerelle, Judith Ms, LLL (annotator) Desoyer, Adèle Ms, LATTICE (developer) Lefeuvre, Anaïs Dr, LI (researcher) Schang, Emmanuel Dr, LLL (researcher) Tellier, Isabelle Pr, LATTICE (researcher) Landragin, Frederic Dr, LATTICE (researcher) Eskhol, Iris Dr, LLL (researcher) Maurel, Denis Pr, LI (researcher) Villaneau, Jeanne Dr, IRISA (researcher) Antoine, Jean-Yves Pr, LI (depositor) Laboratoire d'Informatique (LI, Tours FR) (publisher) Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher) Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher) |
format |
Dataset |
author |
Antoine, Jean-Yves Pr, LI |
author_facet |
Antoine, Jean-Yves Pr, LI |
author_sort |
Antoine, Jean-Yves Pr, LI |
title |
Corpus ANCOR Centre |
title_short |
Corpus ANCOR Centre |
title_full |
Corpus ANCOR Centre |
title_fullStr |
Corpus ANCOR Centre |
title_full_unstemmed |
Corpus ANCOR Centre |
title_sort |
corpus ancor centre |
publisher |
Laboratoire d'Informatique (LI, Tours FR) |
publishDate |
2014 |
url |
http://hdl.handle.net/11041/ortolang-000903 http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml http://hdl.handle.net/11041/ortolang-000903/olac.xml http://hdl.handle.net/11041/ortolang-000903/rdf.html http://sldr.org/logo/LogoOrtolang_small.png |
genre |
Iceland |
genre_facet |
Iceland |
op_source |
source data datos de origen données source 源数据 |
op_rights |
info:eu-repo/date/submitted/2014-10-30 http://creativecommons.org/licenses/by-nc-sa/4.0/ Free access under Attribution-NonCommercial-ShareAlike 4.0 International License info:eu-repo/semantics/openAccess Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) Documents freely communicated. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) 自由地被传达的文件 (Code du Patrimoine, 艺术。L. 211-1, L. 211-4, L. 213-1) Documentos libremente comunicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) |
op_rightsnorm |
CC-BY-NC-SA |
_version_ |
1766041803477221376 |
spelling |
ftsldr:oai:sldr.org:ortolang-000903 2023-05-15T16:51:41+02:00 Corpus ANCOR Centre Antoine, Jean-Yves Pr, LI Boyer-Pelletier, Aurore Ms, LLL (annotator) Muzerelle, Judith Ms, LLL (annotator) Desoyer, Adèle Ms, LATTICE (developer) Lefeuvre, Anaïs Dr, LI (researcher) Schang, Emmanuel Dr, LLL (researcher) Tellier, Isabelle Pr, LATTICE (researcher) Landragin, Frederic Dr, LATTICE (researcher) Eskhol, Iris Dr, LLL (researcher) Maurel, Denis Pr, LI (researcher) Villaneau, Jeanne Dr, IRISA (researcher) Antoine, Jean-Yves Pr, LI (depositor) Laboratoire d'Informatique (LI, Tours FR) (publisher) Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher) Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher) 2014-10-26 application/pdf text/plain application/xml annotations http://hdl.handle.net/11041/ortolang-000903 http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml http://hdl.handle.net/11041/ortolang-000903/olac.xml http://hdl.handle.net/11041/ortolang-000903/rdf.html http://sldr.org/logo/LogoOrtolang_small.png fra fre Laboratoire d'Informatique (LI, Tours FR) Laboratoire Ligérien de Linguistique (LLL, Orléans FR) Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) info:eu-repo/date/submitted/2014-10-30 http://creativecommons.org/licenses/by-nc-sa/4.0/ Free access under Attribution-NonCommercial-ShareAlike 4.0 International License info:eu-repo/semantics/openAccess Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) Documents freely communicated. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) 自由地被传达的文件 (Code du Patrimoine, 艺术。L. 211-1, L. 211-4, L. 213-1) Documentos libremente comunicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) CC-BY-NC-SA source data datos de origen données source 源数据 linguistic field: computational_linguistics linguistic field: text_and_corpus_linguistics linguistic field: general_linguistics coreference anaphora conversational speech coréférence anaphore parole spontanée info:eu-repo/semantics/dataset Dataset 2014 ftsldr 2018-10-11T13:11:49Z ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution. MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. http://hal.archives-ouvertes.fr/hal-01075679 Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562]. http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf https://hal.archives-ouvertes.fr/hal-01016562 Dataset Iceland Speech and Language Data Repository (SLDR/ORTOLANG) |