Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène
International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to de...
Main Authors: | , , |
---|---|
Other Authors: | , , , , , , |
Format: | Article in Journal/Newspaper |
Language: | French |
Published: |
HAL CCSD
2018
|
Subjects: | |
Online Access: | https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 |
id |
fttriple:oai:gotriple.eu:10670/1.8ak91q |
---|---|
record_format |
openpolar |
spelling |
fttriple:oai:gotriple.eu:10670/1.8ak91q 2023-05-15T18:12:43+02:00 Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène Syntactic analysis of languages with low endowments based on multilingual word diving. Syntactical analysis of languages with low endowment of multilingual words: Application to North Sami and Komi-zyriene Lim, KyungTae Partanen, Niko Poibeau, Thierry Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice) Département Littératures et langage - ENS Paris (LILA) École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3 Les travaux décrits ont été en partie effectués dans le cadre du projet LAKME, financé par l’université Paris Sciences et Lettres (IDEX PSL référence ANR-10-IDEX-0001-02). Cette recherche a aussi bé- néficié du soutien d’un projet RGNF-CNRS entre le Lattice et l’université d’État des sciences humaines de Russie. Lakme 2018-01-01 https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 fr fre HAL CCSD ATALA (Association pour le Traitement Automatique des Langues) hal-02268956 10670/1.8ak91q https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 other Hyper Article en Ligne - Sciences de l'Homme et de la Société ISSN: 1248-9433 EISSN: 1965-0906 Revue TAL Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2018, Traitement automatique des langues peu dotées, 59 (3), pp.67-91 Parsing Multilingual models Word embeddings Low-resource languages Komi-zyriène Same du nord Analyse syntaxique Modèles multilingues Plongements de mots Langues peu dotées lang litt Journal Article https://vocabularies.coar-repositories.org/resource_types/c_6501/ 2018 fttriple 2023-01-22T18:52:48Z International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to determine the best language combination for learning. The approach yields competitive results in contexts considered as linguistically difficult. Cet article présente une tentative pour appliquer des méthodes d'analyse syntaxique performantes, à base de réseaux de neurones récursifs, à des langues pour lesquelles on dispose de très peu de ressources. Nous proposons une méthode originale à base de plongements de mots multilingues obtenus à partir de langues plus ou moins proches typologiquement, afin de déterminer la meilleure combinaison de langues possibles pour l'apprentissage. L'approche a permis d'obtenir des résultats encourageants dans des contextes considérés comme linguisti-quement difficiles. Le code source est disponible en ligne (voir https://github.com/jujbob). Article in Journal/Newspaper sami Unknown |
institution |
Open Polar |
collection |
Unknown |
op_collection_id |
fttriple |
language |
French |
topic |
Parsing Multilingual models Word embeddings Low-resource languages Komi-zyriène Same du nord Analyse syntaxique Modèles multilingues Plongements de mots Langues peu dotées lang litt |
spellingShingle |
Parsing Multilingual models Word embeddings Low-resource languages Komi-zyriène Same du nord Analyse syntaxique Modèles multilingues Plongements de mots Langues peu dotées lang litt Lim, KyungTae Partanen, Niko Poibeau, Thierry Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
topic_facet |
Parsing Multilingual models Word embeddings Low-resource languages Komi-zyriène Same du nord Analyse syntaxique Modèles multilingues Plongements de mots Langues peu dotées lang litt |
description |
International audience This article presents an attempt to apply efficient parsing methods based on recur- sive neural networks to languages for which very few resources are available. We propose an original approach based on multilingual word embeddings acquired from different languages so as to determine the best language combination for learning. The approach yields competitive results in contexts considered as linguistically difficult. Cet article présente une tentative pour appliquer des méthodes d'analyse syntaxique performantes, à base de réseaux de neurones récursifs, à des langues pour lesquelles on dispose de très peu de ressources. Nous proposons une méthode originale à base de plongements de mots multilingues obtenus à partir de langues plus ou moins proches typologiquement, afin de déterminer la meilleure combinaison de langues possibles pour l'apprentissage. L'approche a permis d'obtenir des résultats encourageants dans des contextes considérés comme linguisti-quement difficiles. Le code source est disponible en ligne (voir https://github.com/jujbob). |
author2 |
Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice) Département Littératures et langage - ENS Paris (LILA) École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris) Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3 Les travaux décrits ont été en partie effectués dans le cadre du projet LAKME, financé par l’université Paris Sciences et Lettres (IDEX PSL référence ANR-10-IDEX-0001-02). Cette recherche a aussi bé- néficié du soutien d’un projet RGNF-CNRS entre le Lattice et l’université d’État des sciences humaines de Russie. Lakme |
format |
Article in Journal/Newspaper |
author |
Lim, KyungTae Partanen, Niko Poibeau, Thierry |
author_facet |
Lim, KyungTae Partanen, Niko Poibeau, Thierry |
author_sort |
Lim, KyungTae |
title |
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
title_short |
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
title_full |
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
title_fullStr |
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
title_full_unstemmed |
Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: Application au same du nord et au komi-zyriène |
title_sort |
analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues: application au same du nord et au komi-zyriène |
publisher |
HAL CCSD |
publishDate |
2018 |
url |
https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 |
genre |
sami |
genre_facet |
sami |
op_source |
Hyper Article en Ligne - Sciences de l'Homme et de la Société ISSN: 1248-9433 EISSN: 1965-0906 Revue TAL Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2018, Traitement automatique des langues peu dotées, 59 (3), pp.67-91 |
op_relation |
hal-02268956 10670/1.8ak91q https://hal.archives-ouvertes.fr/hal-02268956/file/TAL59-3-Lim.pdf https://hal.archives-ouvertes.fr/hal-02268956 |
op_rights |
other |
_version_ |
1766185211747368960 |