Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène

International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to de...

Full description

Bibliographic Details
Main Authors: Lim, KyungTae, Partanen, Niko, Poibeau, Thierry
Other Authors: Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice), Département Littératures et langage - ENS Paris (LILA), École normale supérieure - Paris (ENS Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3, Les travaux décrits ont été en partie effectués dans le cadre du projet LAKME, financé par l’université Paris Sciences et Lettres (IDEX PSL référence ANR-10-IDEX-0001-02). Cette recherche a aussi bé- néficié du soutien d’un projet RGNF-CNRS entre le Lattice et l’université d’État des sciences humaines de Russie., Lakme
Format: Article in Journal/Newspaper
Language:French
Published: HAL CCSD 2018
Subjects:
Online Access:https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf
https://hal.archives-ouvertes.fr/hal-02268956
id fttriple:oai:gotriple.eu:10670/1.8ak91q
record_format openpolar
spelling fttriple:oai:gotriple.eu:10670/1.8ak91q 2023-05-15T18:12:43+02:00 Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène Syntactic analysis of languages with low endowments based on multilingual word diving. Syntactical analysis of languages with low endowment of multilingual words: Application to North Sami and Komi-zyriene Lim, KyungTae Partanen, Niko Poibeau, Thierry Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice) Département Littératures et langage - ENS Paris (LILA) École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3 Les travaux décrits ont été en partie effectués dans le cadre du projet LAKME, financé par l’université Paris Sciences et Lettres (IDEX PSL référence ANR-10-IDEX-0001-02). Cette recherche a aussi bé- néficié du soutien d’un projet RGNF-CNRS entre le Lattice et l’université d’État des sciences humaines de Russie. Lakme 2018-01-01 https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 fr fre HAL CCSD ATALA (Association pour le Traitement Automatique des Langues) hal-02268956 10670/1.8ak91q https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 other Hyper Article en Ligne - Sciences de l'Homme et de la Société ISSN: 1248-9433 EISSN: 1965-0906 Revue TAL Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2018, Traitement automatique des langues peu dotées, 59 (3), pp.67-91 Parsing Multilingual models Word embeddings Low-resource languages Komi-zyriène Same du nord Analyse syntaxique Modèles multilingues Plongements de mots Langues peu dotées lang litt Journal Article https://vocabularies.coar-repositories.org/resource_types/c_6501/ 2018 fttriple 2023-01-22T18:52:48Z International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to determine the best language combination for learning. The approach yields competitive results in contexts considered as linguistically difficult. Cet article présente une tentative pour appliquer des méthodes d'analyse syntaxique performantes, à base de réseaux de neurones récursifs, à des langues pour lesquelles on dispose de très peu de ressources. Nous proposons une méthode originale à base de plongements de mots multilingues obtenus à partir de langues plus ou moins proches typologiquement, afin de déterminer la meilleure combinaison de langues possibles pour l'apprentissage. L'approche a permis d'obtenir des résultats encourageants dans des contextes considérés comme linguisti-quement difficiles. Le code source est disponible en ligne (voir https://github.com/jujbob). Article in Journal/Newspaper sami Unknown
institution Open Polar
collection Unknown
op_collection_id fttriple
language French
topic Parsing
Multilingual models
Word embeddings
Low-resource languages
Komi-zyriène
Same du nord
Analyse syntaxique
Modèles multilingues
Plongements de mots
Langues peu dotées
lang
litt
spellingShingle Parsing
Multilingual models
Word embeddings
Low-resource languages
Komi-zyriène
Same du nord
Analyse syntaxique
Modèles multilingues
Plongements de mots
Langues peu dotées
lang
litt
Lim, KyungTae
Partanen, Niko
Poibeau, Thierry
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
topic_facet Parsing
Multilingual models
Word embeddings
Low-resource languages
Komi-zyriène
Same du nord
Analyse syntaxique
Modèles multilingues
Plongements de mots
Langues peu dotées
lang
litt
description International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to determine the best language combination for learning. The approach yields competitive results in contexts considered as linguistically difficult. Cet article présente une tentative pour appliquer des méthodes d'analyse syntaxique performantes, à base de réseaux de neurones récursifs, à des langues pour lesquelles on dispose de très peu de ressources. Nous proposons une méthode originale à base de plongements de mots multilingues obtenus à partir de langues plus ou moins proches typologiquement, afin de déterminer la meilleure combinaison de langues possibles pour l'apprentissage. L'approche a permis d'obtenir des résultats encourageants dans des contextes considérés comme linguisti-quement difficiles. Le code source est disponible en ligne (voir https://github.com/jujbob).
author2 Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice)
Département Littératures et langage - ENS Paris (LILA)
École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3
Les travaux décrits ont été en partie effectués dans le cadre du projet LAKME, financé par l’université Paris Sciences et Lettres (IDEX PSL référence ANR-10-IDEX-0001-02). Cette recherche a aussi bé- néficié du soutien d’un projet RGNF-CNRS entre le Lattice et l’université d’État des sciences humaines de Russie.
Lakme
format Article in Journal/Newspaper
author Lim, KyungTae
Partanen, Niko
Poibeau, Thierry
author_facet Lim, KyungTae
Partanen, Niko
Poibeau, Thierry
author_sort Lim, KyungTae
title Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
title_short Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
title_full Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
title_fullStr Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
title_full_unstemmed Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
title_sort analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: application au same du nord et au komi-zyriène
publisher HAL CCSD
publishDate 2018
url https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf
https://hal.archives-ouvertes.fr/hal-02268956
genre sami
genre_facet sami
op_source Hyper Article en Ligne - Sciences de l'Homme et de la Société
ISSN: 1248-9433
EISSN: 1965-0906
Revue TAL
Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2018, Traitement automatique des langues peu dotées, 59 (3), pp.67-91
op_relation hal-02268956
10670/1.8ak91q
https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf
https://hal.archives-ouvertes.fr/hal-02268956
op_rights other
_version_ 1766185211747368960