Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task

This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The vari...

Full description

Bibliographic Details
Main Authors: Líška Martin, Sojka Petr, Růžička Michal
Format: Article in Journal/Newspaper
Language:English
Published: National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan 2013
Subjects:
DML
Online Access:https://is.muni.cz/publication/1112631
id ftmasarykis:oai:is.muni.cz:1112631
record_format openpolar
spelling ftmasarykis:oai:is.muni.cz:1112631 2023-10-25T01:38:03+02:00 Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task Líška Martin Sojka Petr Růžička Michal 2013 6 https://is.muni.cz/publication/1112631 eng eng National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan https://is.muni.cz/publication/1112631 info:eu-repo/semantics/restrictedAccess Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies math indexing and retrieval mathematical digital libraries information systems information retrieval mathematical content search document ranking of mathematical papers math text mining WebMIaS MIaS;TeX Lucene MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika info:eu-repo/semantics/article D 2013 ftmasarykis 2023-09-28T15:12:36Z This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML. Article in Journal/Newspaper DML Masaryk University: Open Services of Information System
institution Open Polar
collection Masaryk University: Open Services of Information System
op_collection_id ftmasarykis
language English
topic math indexing and retrieval
mathematical digital libraries
information systems
information retrieval
mathematical content search
document ranking of mathematical papers
math text mining
WebMIaS
MIaS;TeX
Lucene
MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
spellingShingle math indexing and retrieval
mathematical digital libraries
information systems
information retrieval
mathematical content search
document ranking of mathematical papers
math text mining
WebMIaS
MIaS;TeX
Lucene
MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
Líška Martin
Sojka Petr
Růžička Michal
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
topic_facet math indexing and retrieval
mathematical digital libraries
information systems
information retrieval
mathematical content search
document ranking of mathematical papers
math text mining
WebMIaS
MIaS;TeX
Lucene
MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
description This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML.
format Article in Journal/Newspaper
author Líška Martin
Sojka Petr
Růžička Michal
author_facet Líška Martin
Sojka Petr
Růžička Michal
author_sort Líška Martin
title Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
title_short Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
title_full Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
title_fullStr Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
title_full_unstemmed Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
title_sort similarity search for mathematics: masaryk university team at the ntcir-10 math task
publisher National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan
publishDate 2013
url https://is.muni.cz/publication/1112631
genre DML
genre_facet DML
op_source Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies
op_relation https://is.muni.cz/publication/1112631
op_rights info:eu-repo/semantics/restrictedAccess
_version_ 1780733041827643392