ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING
В работе приведены результаты экспериментов, проведенных с целью сравнительного анализа качества работы существующих облачных сервисов по обработке текстов на русском языке. В статье приводится обзор 10-ти облачных сервисов: TextRazor, RosetteTextAnalytics, EurekaEngine, CloudNaturalLanguage, Texter...
Main Authors: | , , , , |
---|---|
Format: | Text |
Language: | Russian |
Published: |
Международный научный журнал “Современные информационные технологии и ИТ-образование”
2018
|
Subjects: | |
Online Access: | https://dx.doi.org/10.25559/sitito.14.201804.872-880 http://sitito.cs.msu.ru/index.php/SITITO/article/view/453 |
id |
ftdatacite:10.25559/sitito.14.201804.872-880 |
---|---|
record_format |
openpolar |
spelling |
ftdatacite:10.25559/sitito.14.201804.872-880 2023-05-15T18:30:48+02:00 ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING Mukhamediev, R.I. Symagulov, A. Kuchin, Y.I. Abdullayeva, S. Abdoldina, F.N. 2018 https://dx.doi.org/10.25559/sitito.14.201804.872-880 http://sitito.cs.msu.ru/index.php/SITITO/article/view/453 ru rus Международный научный журнал “Современные информационные технологии и ИТ-образование” http://sitito.cs.msu.ru/index.php/SITITO/article/view/453 Обработка естественного языка ОЕЯ обработка естественно-языковых текстов облачные сервисы программное обеспечение как сервис морфологическая разметка распознавание именованных сущностей тональность категоризация текстов Accuracy Precision Recall гармоническое среднее Natural language processing NLP Word processing Cloud services Software as a service SaaS Natural language texts processing Part of speech tagging Named entity recognition Sentiment analysis Text categorization Harmonic average Text article-journal Journal Article ScholarlyArticle 2018 ftdatacite https://doi.org/10.25559/sitito.14.201804.872-880 2021-11-05T12:55:41Z В работе приведены результаты экспериментов, проведенных с целью сравнительного анализа качества работы существующих облачных сервисов по обработке текстов на русском языке. В статье приводится обзор 10-ти облачных сервисов: TextRazor, RosetteTextAnalytics, EurekaEngine, CloudNaturalLanguage, Texterra, Pullenti, NER-ru, UDPipe, AOT, DeepPavlov. Количественные исследования качества работы выполнены для 6-ти из них. В процессе оценки сервисов анализировалось выполнение таких функций, как частеречная разметка, анализ тональности, распознавание именованных сущностей и категоризация текстов. Для сравнительной оценки качества работы сервисов были использованы материалы соревнований: factRuEval-2016 (выявление именованных сущностей), AlemResearch (тональность) и корпуса текстов, Taiga и OpenCorpora (морфологическая разметка). Качество распознавания именованных сущностей оценивалось путем расчета параметров Accuracy, Precision, Recall и F1. В результате проведенного исследования показано, что при решении задач обработки текста на русском языке для распознавания именованных сущностей и определения тональности текста наилучший результат показывает сервис EurekaEngine, а для частеречной разметки текста – сервис RosetteTextAnalytics, для категоризации текста – сервис TextRazor. : The paper presents the results of experiments conducted with the aim of a comparative analysis of the performance of the existing cloud services for natural language processing in Russian. The article provides an overview of 10 cloud services: TextRazor, RosetteTextAnalytics, EurekaEngine, CloudNaturalLanguage, Texterra, Pullenti, NER-ru, UDPipe, AOT, DeepPavlov. Quantitative studies of their performance were made for 6 of them. In the process of evaluating services, the execution of such functions as the part of speech tagging, sentiment analysis, named entity recognition and the categorization of texts were analyzed. For a comparative assessment of the quality of the services, the following competition materials were used: factRuEval-2016 (named entities), AlemResearch (sentiment) and the corpora, Taiga and OpenCorpora (part of speech). The named entities recognition quality was evaluated by calculating Accuracy, Precision, Recall, and F1 parameters. As a result of the study, it was shown that when solving natural language text processing tasks in Russian, the best result is shown by the EurekaEngine service for recognizing named entities and sentiment analysis of the text, RosetteTextAnalytics service proved best in part of speech tagging the and TextRazor service in text categorization. : №4 (2019) Text taiga DataCite Metadata Store (German National Library of Science and Technology) Ner ENVELOPE(6.622,6.622,62.612,62.612) |
institution |
Open Polar |
collection |
DataCite Metadata Store (German National Library of Science and Technology) |
op_collection_id |
ftdatacite |
language |
Russian |
topic |
Обработка естественного языка ОЕЯ обработка естественно-языковых текстов облачные сервисы программное обеспечение как сервис морфологическая разметка распознавание именованных сущностей тональность категоризация текстов Accuracy Precision Recall гармоническое среднее Natural language processing NLP Word processing Cloud services Software as a service SaaS Natural language texts processing Part of speech tagging Named entity recognition Sentiment analysis Text categorization Harmonic average |
spellingShingle |
Обработка естественного языка ОЕЯ обработка естественно-языковых текстов облачные сервисы программное обеспечение как сервис морфологическая разметка распознавание именованных сущностей тональность категоризация текстов Accuracy Precision Recall гармоническое среднее Natural language processing NLP Word processing Cloud services Software as a service SaaS Natural language texts processing Part of speech tagging Named entity recognition Sentiment analysis Text categorization Harmonic average Mukhamediev, R.I. Symagulov, A. Kuchin, Y.I. Abdullayeva, S. Abdoldina, F.N. ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
topic_facet |
Обработка естественного языка ОЕЯ обработка естественно-языковых текстов облачные сервисы программное обеспечение как сервис морфологическая разметка распознавание именованных сущностей тональность категоризация текстов Accuracy Precision Recall гармоническое среднее Natural language processing NLP Word processing Cloud services Software as a service SaaS Natural language texts processing Part of speech tagging Named entity recognition Sentiment analysis Text categorization Harmonic average |
description |
В работе приведены результаты экспериментов, проведенных с целью сравнительного анализа качества работы существующих облачных сервисов по обработке текстов на русском языке. В статье приводится обзор 10-ти облачных сервисов: TextRazor, RosetteTextAnalytics, EurekaEngine, CloudNaturalLanguage, Texterra, Pullenti, NER-ru, UDPipe, AOT, DeepPavlov. Количественные исследования качества работы выполнены для 6-ти из них. В процессе оценки сервисов анализировалось выполнение таких функций, как частеречная разметка, анализ тональности, распознавание именованных сущностей и категоризация текстов. Для сравнительной оценки качества работы сервисов были использованы материалы соревнований: factRuEval-2016 (выявление именованных сущностей), AlemResearch (тональность) и корпуса текстов, Taiga и OpenCorpora (морфологическая разметка). Качество распознавания именованных сущностей оценивалось путем расчета параметров Accuracy, Precision, Recall и F1. В результате проведенного исследования показано, что при решении задач обработки текста на русском языке для распознавания именованных сущностей и определения тональности текста наилучший результат показывает сервис EurekaEngine, а для частеречной разметки текста – сервис RosetteTextAnalytics, для категоризации текста – сервис TextRazor. : The paper presents the results of experiments conducted with the aim of a comparative analysis of the performance of the existing cloud services for natural language processing in Russian. The article provides an overview of 10 cloud services: TextRazor, RosetteTextAnalytics, EurekaEngine, CloudNaturalLanguage, Texterra, Pullenti, NER-ru, UDPipe, AOT, DeepPavlov. Quantitative studies of their performance were made for 6 of them. In the process of evaluating services, the execution of such functions as the part of speech tagging, sentiment analysis, named entity recognition and the categorization of texts were analyzed. For a comparative assessment of the quality of the services, the following competition materials were used: factRuEval-2016 (named entities), AlemResearch (sentiment) and the corpora, Taiga and OpenCorpora (part of speech). The named entities recognition quality was evaluated by calculating Accuracy, Precision, Recall, and F1 parameters. As a result of the study, it was shown that when solving natural language text processing tasks in Russian, the best result is shown by the EurekaEngine service for recognizing named entities and sentiment analysis of the text, RosetteTextAnalytics service proved best in part of speech tagging the and TextRazor service in text categorization. : №4 (2019) |
format |
Text |
author |
Mukhamediev, R.I. Symagulov, A. Kuchin, Y.I. Abdullayeva, S. Abdoldina, F.N. |
author_facet |
Mukhamediev, R.I. Symagulov, A. Kuchin, Y.I. Abdullayeva, S. Abdoldina, F.N. |
author_sort |
Mukhamediev, R.I. |
title |
ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
title_short |
ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
title_full |
ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
title_fullStr |
ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
title_full_unstemmed |
ОБЛАЧНЫЕ СЕРВИСЫ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ : CLOUD SERVICES FOR NATURAL LANGUAGE PROCESSING |
title_sort |
облачные сервисы для обработки текстов на естественном языке : cloud services for natural language processing |
publisher |
Международный научный журнал “Современные информационные технологии и ИТ-образование” |
publishDate |
2018 |
url |
https://dx.doi.org/10.25559/sitito.14.201804.872-880 http://sitito.cs.msu.ru/index.php/SITITO/article/view/453 |
long_lat |
ENVELOPE(6.622,6.622,62.612,62.612) |
geographic |
Ner |
geographic_facet |
Ner |
genre |
taiga |
genre_facet |
taiga |
op_relation |
http://sitito.cs.msu.ru/index.php/SITITO/article/view/453 |
op_doi |
https://doi.org/10.25559/sitito.14.201804.872-880 |
_version_ |
1766214396700262400 |