Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The vari...
Main Authors: | , , |
---|---|
Format: | Article in Journal/Newspaper |
Language: | English |
Published: |
National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan
2013
|
Subjects: | |
Online Access: | https://is.muni.cz/publication/1112631 |
id |
ftmasarykis:oai:is.muni.cz:1112631 |
---|---|
record_format |
openpolar |
spelling |
ftmasarykis:oai:is.muni.cz:1112631 2023-10-25T01:38:03+02:00 Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task Líška Martin Sojka Petr Růžička Michal 2013 6 https://is.muni.cz/publication/1112631 eng eng National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan https://is.muni.cz/publication/1112631 info:eu-repo/semantics/restrictedAccess Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies math indexing and retrieval mathematical digital libraries information systems information retrieval mathematical content search document ranking of mathematical papers math text mining WebMIaS MIaS;TeX Lucene MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika info:eu-repo/semantics/article D 2013 ftmasarykis 2023-09-28T15:12:36Z This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML. Article in Journal/Newspaper DML Masaryk University: Open Services of Information System |
institution |
Open Polar |
collection |
Masaryk University: Open Services of Information System |
op_collection_id |
ftmasarykis |
language |
English |
topic |
math indexing and retrieval mathematical digital libraries information systems information retrieval mathematical content search document ranking of mathematical papers math text mining WebMIaS MIaS;TeX Lucene MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika |
spellingShingle |
math indexing and retrieval mathematical digital libraries information systems information retrieval mathematical content search document ranking of mathematical papers math text mining WebMIaS MIaS;TeX Lucene MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika Líška Martin Sojka Petr Růžička Michal Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
topic_facet |
math indexing and retrieval mathematical digital libraries information systems information retrieval mathematical content search document ranking of mathematical papers math text mining WebMIaS MIaS;TeX Lucene MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika |
description |
This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML. |
format |
Article in Journal/Newspaper |
author |
Líška Martin Sojka Petr Růžička Michal |
author_facet |
Líška Martin Sojka Petr Růžička Michal |
author_sort |
Líška Martin |
title |
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
title_short |
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
title_full |
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
title_fullStr |
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
title_full_unstemmed |
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task |
title_sort |
similarity search for mathematics: masaryk university team at the ntcir-10 math task |
publisher |
National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan |
publishDate |
2013 |
url |
https://is.muni.cz/publication/1112631 |
genre |
DML |
genre_facet |
DML |
op_source |
Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies |
op_relation |
https://is.muni.cz/publication/1112631 |
op_rights |
info:eu-repo/semantics/restrictedAccess |
_version_ |
1780733041827643392 |