Developing a French FrameNet: Methodology and First results

International audience The Asfalda project aims to develop a French corpus with frame-based semantic annotations and automatic tools for shallow semantic analysis. We present the first part of the project: focusing on a set of notional domains, we delimited a subset of English frames, adapted them to...

Full description

Bibliographic Details
Main Authors: Candito, Marie, Amsili, Pascal, Barque, Lucie, Benamara, Farah, De Chalendar, Gaël, Djemaa, Marianne, Haas, Pauline, Huyghe, Richard, Mathieu, Yvette Yannick, Muller, Philippe, Sagot, Benoît, Vieu, Laure
Other Authors: Analyse Linguistique Profonde à Grande Echelle, Large-scale deep linguistic processing (ALPAGE), Université Paris Diderot - Paris 7 (UPD7)-Inria Paris-Rocquencourt, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Laboratoire de Linguistique Formelle (LLF UMR7110), Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse III - Paul Sabatier (UT3), Laboratoire Vision et Ingénierie des Contenus (LVIC), Département Intelligence Ambiante et Systèmes Interactifs (DIASI), Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay, Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice), Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris sciences et lettres (PSL)-Département Littératures et langage (LILA), École normale supérieure - Paris (ENS Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris), Université Paris sciences et lettres (PSL), Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus (CLILLAC-ARP (EA_3967)), Université Paris Diderot - Paris 7 (UPD7), Centre National de la Recherche Scientifique (CNRS), ANR-12-CORD-023 - ASFALDA - Projet ANR ASFALDA - French FrameNetANR ASFALDA (ANR-12-CORD-023), ANR-11-IDEX-0005,USPC,Université Sorbonne Paris Cité(2011), ANR-12-CORD-0023,ASFALDA,Analyse Sémantique en Frames : Annotation, Lexique, Discours et Automatisation(2012)
Format: Conference Object
Language:English
Published: HAL CCSD 2014
Subjects:
Online Access:https://hal.inria.fr/hal-01022385
https://hal.inria.fr/hal-01022385/document
https://hal.inria.fr/hal-01022385/file/asfalda_lrec2014.final_keywords.pdf
id ftccsdartic:oai:HAL:hal-01022385v1
record_format openpolar
institution Open Polar
collection Archive ouverte HAL (Hyper Article en Ligne, CCSD - Centre pour la Communication Scientifique Directe)
op_collection_id ftccsdartic
language English
topic French FrameNet
lexicon
semantic frames
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
spellingShingle French FrameNet
lexicon
semantic frames
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
Candito, Marie
Amsili, Pascal
Barque, Lucie
Benamara, Farah
De Chalendar, Gaël
Djemaa, Marianne
Haas, Pauline
Huyghe, Richard
Mathieu, Yvette Yannick
Muller, Philippe
Sagot, Benoît
Vieu, Laure
Developing a French FrameNet: Methodology and First results
topic_facet French FrameNet
lexicon
semantic frames
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
description International audience The Asfalda project aims to develop a French corpus with frame-based semantic annotations and automatic tools for shallow semantic analysis. We present the first part of the project: focusing on a set of notional domains, we delimited a subset of English frames, adapted them to French data when necessary, and developed the corresponding French lexicon. We believe that working domain by domain helped us to enforce the coherence of the resulting resource, and also has the advantage that, though the number of frames is limited (around a hundred), we obtain full coverage within a given domain.
author2 Analyse Linguistique Profonde à Grande Echelle
Large-scale deep linguistic processing (ALPAGE)
Université Paris Diderot - Paris 7 (UPD7)-Inria Paris-Rocquencourt
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Laboratoire de Linguistique Formelle (LLF UMR7110)
Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS)
MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI)
Institut de recherche en informatique de Toulouse (IRIT)
Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées
Université Toulouse III - Paul Sabatier (UT3)
Laboratoire Vision et Ingénierie des Contenus (LVIC)
Département Intelligence Ambiante et Systèmes Interactifs (DIASI)
Laboratoire d'Intégration des Systèmes et des Technologies (LIST)
Direction de Recherche Technologique (CEA) (DRT (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Laboratoire d'Intégration des Systèmes et des Technologies (LIST)
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay
Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice)
Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris sciences et lettres (PSL)-Département Littératures et langage (LILA)
École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)
Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus (CLILLAC-ARP (EA_3967))
Université Paris Diderot - Paris 7 (UPD7)
Centre National de la Recherche Scientifique (CNRS)
ANR-12-CORD-023 - ASFALDA - Projet ANR ASFALDA - French FrameNetANR ASFALDA (ANR-12-CORD-023)
ANR-11-IDEX-0005,USPC,Université Sorbonne Paris Cité(2011)
ANR-12-CORD-0023,ASFALDA,Analyse Sémantique en Frames : Annotation, Lexique, Discours et Automatisation(2012)
format Conference Object
author Candito, Marie
Amsili, Pascal
Barque, Lucie
Benamara, Farah
De Chalendar, Gaël
Djemaa, Marianne
Haas, Pauline
Huyghe, Richard
Mathieu, Yvette Yannick
Muller, Philippe
Sagot, Benoît
Vieu, Laure
author_facet Candito, Marie
Amsili, Pascal
Barque, Lucie
Benamara, Farah
De Chalendar, Gaël
Djemaa, Marianne
Haas, Pauline
Huyghe, Richard
Mathieu, Yvette Yannick
Muller, Philippe
Sagot, Benoît
Vieu, Laure
author_sort Candito, Marie
title Developing a French FrameNet: Methodology and First results
title_short Developing a French FrameNet: Methodology and First results
title_full Developing a French FrameNet: Methodology and First results
title_fullStr Developing a French FrameNet: Methodology and First results
title_full_unstemmed Developing a French FrameNet: Methodology and First results
title_sort developing a french framenet: methodology and first results
publisher HAL CCSD
publishDate 2014
url https://hal.inria.fr/hal-01022385
https://hal.inria.fr/hal-01022385/document
https://hal.inria.fr/hal-01022385/file/asfalda_lrec2014.final_keywords.pdf
op_coverage Reykjavik, Iceland
genre Iceland
genre_facet Iceland
op_source LREC - The 9th edition of the Language Resources and Evaluation Conference
https://hal.inria.fr/hal-01022385
LREC - The 9th edition of the Language Resources and Evaluation Conference, May 2014, Reykjavik, Iceland
op_relation hal-01022385
https://hal.inria.fr/hal-01022385
https://hal.inria.fr/hal-01022385/document
https://hal.inria.fr/hal-01022385/file/asfalda_lrec2014.final_keywords.pdf
op_rights info:eu-repo/semantics/OpenAccess
_version_ 1766038944169852928
spelling ftccsdartic:oai:HAL:hal-01022385v1 2023-05-15T16:48:51+02:00 Developing a French FrameNet: Methodology and First results Candito, Marie Amsili, Pascal Barque, Lucie Benamara, Farah De Chalendar, Gaël Djemaa, Marianne Haas, Pauline Huyghe, Richard Mathieu, Yvette Yannick Muller, Philippe Sagot, Benoît Vieu, Laure Analyse Linguistique Profonde à Grande Echelle Large-scale deep linguistic processing (ALPAGE) Université Paris Diderot - Paris 7 (UPD7)-Inria Paris-Rocquencourt Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria) Laboratoire de Linguistique Formelle (LLF UMR7110) Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS) MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI) Institut de recherche en informatique de Toulouse (IRIT) Université Toulouse 1 Capitole (UT1) Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3) Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP) Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1) Université Fédérale Toulouse Midi-Pyrénées Université Toulouse III - Paul Sabatier (UT3) Laboratoire Vision et Ingénierie des Contenus (LVIC) Département Intelligence Ambiante et Systèmes Interactifs (DIASI) Laboratoire d'Intégration des Systèmes et des Technologies (LIST) Direction de Recherche Technologique (CEA) (DRT (CEA)) Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA)) Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Laboratoire d'Intégration des Systèmes et des Technologies (LIST) Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice) Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris sciences et lettres (PSL)-Département Littératures et langage (LILA) École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL) Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus (CLILLAC-ARP (EA_3967)) Université Paris Diderot - Paris 7 (UPD7) Centre National de la Recherche Scientifique (CNRS) ANR-12-CORD-023 - ASFALDA - Projet ANR ASFALDA - French FrameNetANR ASFALDA (ANR-12-CORD-023) ANR-11-IDEX-0005,USPC,Université Sorbonne Paris Cité(2011) ANR-12-CORD-0023,ASFALDA,Analyse Sémantique en Frames : Annotation, Lexique, Discours et Automatisation(2012) Reykjavik, Iceland 2014-05-28 https://hal.inria.fr/hal-01022385 https://hal.inria.fr/hal-01022385/document https://hal.inria.fr/hal-01022385/file/asfalda_lrec2014.final_keywords.pdf en eng HAL CCSD hal-01022385 https://hal.inria.fr/hal-01022385 https://hal.inria.fr/hal-01022385/document https://hal.inria.fr/hal-01022385/file/asfalda_lrec2014.final_keywords.pdf info:eu-repo/semantics/OpenAccess LREC - The 9th edition of the Language Resources and Evaluation Conference https://hal.inria.fr/hal-01022385 LREC - The 9th edition of the Language Resources and Evaluation Conference, May 2014, Reykjavik, Iceland French FrameNet lexicon semantic frames [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] info:eu-repo/semantics/conferenceObject Conference papers 2014 ftccsdartic 2021-12-19T03:03:45Z International audience The Asfalda project aims to develop a French corpus with frame-based semantic annotations and automatic tools for shallow semantic analysis. We present the first part of the project: focusing on a set of notional domains, we delimited a subset of English frames, adapted them to French data when necessary, and developed the corresponding French lexicon. We believe that working domain by domain helped us to enforce the coherence of the resulting resource, and also has the advantage that, though the number of frames is limited (around a hundred), we obtain full coverage within a given domain. Conference Object Iceland Archive ouverte HAL (Hyper Article en Ligne, CCSD - Centre pour la Communication Scientifique Directe)