Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce

V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so...

Full description

Bibliographic Details
Main Author: Samuel Fabo
Other Authors: Kuznetsov Stanislav, Vašata Daniel
Format: Master Thesis
Language:unknown
Published: České vysoké učení technické v Praze. Vypočetní a informační centrum. 2022
Subjects:
Online Access:http://hdl.handle.net/10467/101099
id ftczechtuniv:oai:dspace.cvut.cz:10467/101099
record_format openpolar
spelling ftczechtuniv:oai:dspace.cvut.cz:10467/101099 2023-05-15T18:13:03+02:00 Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce Module for intent detection in the internet banking domain for the Czech language Samuel Fabo Kuznetsov Stanislav Vašata Daniel 2022-06-03 application/pdf http://hdl.handle.net/10467/101099 unknown České vysoké učení technické v Praze. Vypočetní a informační centrum. Czech Technical University in Prague. Computing and Information Centre. KOS-1065782112405 http://hdl.handle.net/10467/101099 A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html intent detection detekcia zámerov detekcia kontextov chatbot strojové učenie spracovávanie prirodzeného jazyka porozumenie prirodzenému jazyku klasifikácia textu predspracovanie textu machine learning natural language processing natural language understanding text classification text preprocessing diplomová práce master thesis 2022 ftczechtuniv 2022-06-06T23:18:40Z V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so strojom. Keďže neexistujú voľne dostupné dátové sady v českom jazyku na túto doménu, museli sme dáta zozbierať sami. Neskôr sme spojili zozbierané vzorky intentov s voľne dostupnou sadou BANKING77, ktorú sme preložili do češtiny. Podarilo sa nám vyladiť model, ktorý mal na testovacej vzorke spojenej dátovej sady dobré výsledky presnosti. Nakoniec sme nasadili výsledný model do demonštračnej aplikácie. In this thesis, we research and apply various techniques to solve the intent detection problem in the Czech internet banking domain. The intent detector is a fundamental part of each chatbot and keeps the user longer in contact with the machine if a high-quality, fine-tuned detector is used. We needed to gather the training data on our own because there are no publicly available datasets in the Czech language for this domain. Later on, we merged gathered samples of intents with the publicly available dataset BANKING77, which we translated into the Czech language. We succeeded in fine-tuning a model, which had good accuracy results on the test set. We deployed the model to the production version of the demo application. Master Thesis sami Czech Technical University in Prague: Digital Library
institution Open Polar
collection Czech Technical University in Prague: Digital Library
op_collection_id ftczechtuniv
language unknown
topic intent detection
detekcia zámerov
detekcia kontextov
chatbot
strojové učenie
spracovávanie prirodzeného jazyka
porozumenie prirodzenému jazyku
klasifikácia textu
predspracovanie textu
machine learning
natural language processing
natural language understanding
text classification
text preprocessing
spellingShingle intent detection
detekcia zámerov
detekcia kontextov
chatbot
strojové učenie
spracovávanie prirodzeného jazyka
porozumenie prirodzenému jazyku
klasifikácia textu
predspracovanie textu
machine learning
natural language processing
natural language understanding
text classification
text preprocessing
Samuel Fabo
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
topic_facet intent detection
detekcia zámerov
detekcia kontextov
chatbot
strojové učenie
spracovávanie prirodzeného jazyka
porozumenie prirodzenému jazyku
klasifikácia textu
predspracovanie textu
machine learning
natural language processing
natural language understanding
text classification
text preprocessing
description V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so strojom. Keďže neexistujú voľne dostupné dátové sady v českom jazyku na túto doménu, museli sme dáta zozbierať sami. Neskôr sme spojili zozbierané vzorky intentov s voľne dostupnou sadou BANKING77, ktorú sme preložili do češtiny. Podarilo sa nám vyladiť model, ktorý mal na testovacej vzorke spojenej dátovej sady dobré výsledky presnosti. Nakoniec sme nasadili výsledný model do demonštračnej aplikácie. In this thesis, we research and apply various techniques to solve the intent detection problem in the Czech internet banking domain. The intent detector is a fundamental part of each chatbot and keeps the user longer in contact with the machine if a high-quality, fine-tuned detector is used. We needed to gather the training data on our own because there are no publicly available datasets in the Czech language for this domain. Later on, we merged gathered samples of intents with the publicly available dataset BANKING77, which we translated into the Czech language. We succeeded in fine-tuning a model, which had good accuracy results on the test set. We deployed the model to the production version of the demo application.
author2 Kuznetsov Stanislav
Vašata Daniel
format Master Thesis
author Samuel Fabo
author_facet Samuel Fabo
author_sort Samuel Fabo
title Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
title_short Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
title_full Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
title_fullStr Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
title_full_unstemmed Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
title_sort modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
publisher České vysoké učení technické v Praze. Vypočetní a informační centrum.
publishDate 2022
url http://hdl.handle.net/10467/101099
genre sami
genre_facet sami
op_relation KOS-1065782112405
http://hdl.handle.net/10467/101099
op_rights A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
_version_ 1766185539637084160