Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so...
Main Author: | |
---|---|
Other Authors: | , |
Format: | Master Thesis |
Language: | unknown |
Published: |
České vysoké učení technické v Praze. Vypočetní a informační centrum.
2022
|
Subjects: | |
Online Access: | http://hdl.handle.net/10467/101099 |
id |
ftczechtuniv:oai:dspace.cvut.cz:10467/101099 |
---|---|
record_format |
openpolar |
spelling |
ftczechtuniv:oai:dspace.cvut.cz:10467/101099 2023-05-15T18:13:03+02:00 Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce Module for intent detection in the internet banking domain for the Czech language Samuel Fabo Kuznetsov Stanislav Vašata Daniel 2022-06-03 application/pdf http://hdl.handle.net/10467/101099 unknown České vysoké učení technické v Praze. Vypočetní a informační centrum. Czech Technical University in Prague. Computing and Information Centre. KOS-1065782112405 http://hdl.handle.net/10467/101099 A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html intent detection detekcia zámerov detekcia kontextov chatbot strojové učenie spracovávanie prirodzeného jazyka porozumenie prirodzenému jazyku klasifikácia textu predspracovanie textu machine learning natural language processing natural language understanding text classification text preprocessing diplomová práce master thesis 2022 ftczechtuniv 2022-06-06T23:18:40Z V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so strojom. Keďže neexistujú voľne dostupné dátové sady v českom jazyku na túto doménu, museli sme dáta zozbierať sami. Neskôr sme spojili zozbierané vzorky intentov s voľne dostupnou sadou BANKING77, ktorú sme preložili do češtiny. Podarilo sa nám vyladiť model, ktorý mal na testovacej vzorke spojenej dátovej sady dobré výsledky presnosti. Nakoniec sme nasadili výsledný model do demonštračnej aplikácie. In this thesis, we research and apply various techniques to solve the intent detection problem in the Czech internet banking domain. The intent detector is a fundamental part of each chatbot and keeps the user longer in contact with the machine if a high-quality, fine-tuned detector is used. We needed to gather the training data on our own because there are no publicly available datasets in the Czech language for this domain. Later on, we merged gathered samples of intents with the publicly available dataset BANKING77, which we translated into the Czech language. We succeeded in fine-tuning a model, which had good accuracy results on the test set. We deployed the model to the production version of the demo application. Master Thesis sami Czech Technical University in Prague: Digital Library |
institution |
Open Polar |
collection |
Czech Technical University in Prague: Digital Library |
op_collection_id |
ftczechtuniv |
language |
unknown |
topic |
intent detection detekcia zámerov detekcia kontextov chatbot strojové učenie spracovávanie prirodzeného jazyka porozumenie prirodzenému jazyku klasifikácia textu predspracovanie textu machine learning natural language processing natural language understanding text classification text preprocessing |
spellingShingle |
intent detection detekcia zámerov detekcia kontextov chatbot strojové učenie spracovávanie prirodzeného jazyka porozumenie prirodzenému jazyku klasifikácia textu predspracovanie textu machine learning natural language processing natural language understanding text classification text preprocessing Samuel Fabo Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
topic_facet |
intent detection detekcia zámerov detekcia kontextov chatbot strojové učenie spracovávanie prirodzeného jazyka porozumenie prirodzenému jazyku klasifikácia textu predspracovanie textu machine learning natural language processing natural language understanding text classification text preprocessing |
description |
V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so strojom. Keďže neexistujú voľne dostupné dátové sady v českom jazyku na túto doménu, museli sme dáta zozbierať sami. Neskôr sme spojili zozbierané vzorky intentov s voľne dostupnou sadou BANKING77, ktorú sme preložili do češtiny. Podarilo sa nám vyladiť model, ktorý mal na testovacej vzorke spojenej dátovej sady dobré výsledky presnosti. Nakoniec sme nasadili výsledný model do demonštračnej aplikácie. In this thesis, we research and apply various techniques to solve the intent detection problem in the Czech internet banking domain. The intent detector is a fundamental part of each chatbot and keeps the user longer in contact with the machine if a high-quality, fine-tuned detector is used. We needed to gather the training data on our own because there are no publicly available datasets in the Czech language for this domain. Later on, we merged gathered samples of intents with the publicly available dataset BANKING77, which we translated into the Czech language. We succeeded in fine-tuning a model, which had good accuracy results on the test set. We deployed the model to the production version of the demo application. |
author2 |
Kuznetsov Stanislav Vašata Daniel |
format |
Master Thesis |
author |
Samuel Fabo |
author_facet |
Samuel Fabo |
author_sort |
Samuel Fabo |
title |
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
title_short |
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
title_full |
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
title_fullStr |
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
title_full_unstemmed |
Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
title_sort |
modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce |
publisher |
České vysoké učení technické v Praze. Vypočetní a informační centrum. |
publishDate |
2022 |
url |
http://hdl.handle.net/10467/101099 |
genre |
sami |
genre_facet |
sami |
op_relation |
KOS-1065782112405 http://hdl.handle.net/10467/101099 |
op_rights |
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html |
_version_ |
1766185539637084160 |