Corpus ANCOR Centre

ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is...

Full description

Bibliographic Details
Main Author: Antoine, Jean-Yves Pr, LI
Other Authors: Boyer-Pelletier, Aurore Ms, LLL (annotator), Muzerelle, Judith Ms, LLL (annotator), Desoyer, Adèle Ms, LATTICE (developer), Lefeuvre, Anaïs Dr, LI (researcher), Schang, Emmanuel Dr, LLL (researcher), Tellier, Isabelle Pr, LATTICE (researcher), Landragin, Frederic Dr, LATTICE (researcher), Eskhol, Iris Dr, LLL (researcher), Maurel, Denis Pr, LI (researcher), Villaneau, Jeanne Dr, IRISA (researcher), Antoine, Jean-Yves Pr, LI (depositor), Laboratoire d'Informatique (LI, Tours FR) (publisher), Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher)
Format: Dataset
Language:French
Published: Laboratoire d'Informatique (LI, Tours FR) 2014
Subjects:
Online Access:http://hdl.handle.net/11041/ortolang-000903
http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc
http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf
http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html
http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml
http://hdl.handle.net/11041/ortolang-000903/olac.xml
http://hdl.handle.net/11041/ortolang-000903/rdf.html
http://sldr.org/logo/LogoOrtolang_small.png
id ftsldr:oai:sldr.org:ortolang-000903
record_format openpolar
institution Open Polar
collection Speech and Language Data Repository (SLDR/ORTOLANG)
op_collection_id ftsldr
language French
topic linguistic field: computational_linguistics
linguistic field: text_and_corpus_linguistics
linguistic field: general_linguistics
coreference
anaphora
conversational speech
coréférence
anaphore
parole spontanée
spellingShingle linguistic field: computational_linguistics
linguistic field: text_and_corpus_linguistics
linguistic field: general_linguistics
coreference
anaphora
conversational speech
coréférence
anaphore
parole spontanée
Antoine, Jean-Yves Pr, LI
Corpus ANCOR Centre
topic_facet linguistic field: computational_linguistics
linguistic field: text_and_corpus_linguistics
linguistic field: general_linguistics
coreference
anaphora
conversational speech
coréférence
anaphore
parole spontanée
description ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution. MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. http://hal.archives-ouvertes.fr/hal-01075679 Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562]. http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf https://hal.archives-ouvertes.fr/hal-01016562
author2 Boyer-Pelletier, Aurore Ms, LLL (annotator)
Muzerelle, Judith Ms, LLL (annotator)
Desoyer, Adèle Ms, LATTICE (developer)
Lefeuvre, Anaïs Dr, LI (researcher)
Schang, Emmanuel Dr, LLL (researcher)
Tellier, Isabelle Pr, LATTICE (researcher)
Landragin, Frederic Dr, LATTICE (researcher)
Eskhol, Iris Dr, LLL (researcher)
Maurel, Denis Pr, LI (researcher)
Villaneau, Jeanne Dr, IRISA (researcher)
Antoine, Jean-Yves Pr, LI (depositor)
Laboratoire d'Informatique (LI, Tours FR) (publisher)
Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher)
Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher)
format Dataset
author Antoine, Jean-Yves Pr, LI
author_facet Antoine, Jean-Yves Pr, LI
author_sort Antoine, Jean-Yves Pr, LI
title Corpus ANCOR Centre
title_short Corpus ANCOR Centre
title_full Corpus ANCOR Centre
title_fullStr Corpus ANCOR Centre
title_full_unstemmed Corpus ANCOR Centre
title_sort corpus ancor centre
publisher Laboratoire d'Informatique (LI, Tours FR)
publishDate 2014
url http://hdl.handle.net/11041/ortolang-000903
http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc
http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf
http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html
http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml
http://hdl.handle.net/11041/ortolang-000903/olac.xml
http://hdl.handle.net/11041/ortolang-000903/rdf.html
http://sldr.org/logo/LogoOrtolang_small.png
genre Iceland
genre_facet Iceland
op_source source data
datos de origen
données source
源数据
op_rights info:eu-repo/date/submitted/2014-10-30
http://creativecommons.org/licenses/by-nc-sa/4.0/
Free access under Attribution-NonCommercial-ShareAlike 4.0 International License
info:eu-repo/semantics/openAccess
Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)
Documents freely communicated. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)
自由地被传达的文件 (Code du Patrimoine, 艺术。L. 211-1, L. 211-4, L. 213-1)
Documentos libremente comunicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)
op_rightsnorm CC-BY-NC-SA
_version_ 1766041803477221376
spelling ftsldr:oai:sldr.org:ortolang-000903 2023-05-15T16:51:41+02:00 Corpus ANCOR Centre Antoine, Jean-Yves Pr, LI Boyer-Pelletier, Aurore Ms, LLL (annotator) Muzerelle, Judith Ms, LLL (annotator) Desoyer, Adèle Ms, LATTICE (developer) Lefeuvre, Anaïs Dr, LI (researcher) Schang, Emmanuel Dr, LLL (researcher) Tellier, Isabelle Pr, LATTICE (researcher) Landragin, Frederic Dr, LATTICE (researcher) Eskhol, Iris Dr, LLL (researcher) Maurel, Denis Pr, LI (researcher) Villaneau, Jeanne Dr, IRISA (researcher) Antoine, Jean-Yves Pr, LI (depositor) Laboratoire d'Informatique (LI, Tours FR) (publisher) Laboratoire Ligérien de Linguistique (LLL, Orléans FR) (publisher) Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) (publisher) 2014-10-26 application/pdf text/plain application/xml annotations http://hdl.handle.net/11041/ortolang-000903 http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml http://hdl.handle.net/11041/ortolang-000903/olac.xml http://hdl.handle.net/11041/ortolang-000903/rdf.html http://sldr.org/logo/LogoOrtolang_small.png fra fre Laboratoire d'Informatique (LI, Tours FR) Laboratoire Ligérien de Linguistique (LLL, Orléans FR) Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR) info:eu-repo/date/submitted/2014-10-30 http://creativecommons.org/licenses/by-nc-sa/4.0/ Free access under Attribution-NonCommercial-ShareAlike 4.0 International License info:eu-repo/semantics/openAccess Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) Documents freely communicated. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) 自由地被传达的文件 (Code du Patrimoine, 艺术。L. 211-1, L. 211-4, L. 213-1) Documentos libremente comunicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) CC-BY-NC-SA source data datos de origen données source 源数据 linguistic field: computational_linguistics linguistic field: text_and_corpus_linguistics linguistic field: general_linguistics coreference anaphora conversational speech coréférence anaphore parole spontanée info:eu-repo/semantics/dataset Dataset 2014 ftsldr 2018-10-11T13:11:49Z ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution. MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. http://hal.archives-ouvertes.fr/hal-01075679 Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562]. http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf https://hal.archives-ouvertes.fr/hal-01016562 Dataset Iceland Speech and Language Data Repository (SLDR/ORTOLANG)