Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin

Historiallisista, Suomen ja Viron kansallisvaltioiden syntyyn liittyvistä syistä johtuen itämerensuomalaista runolaulua (viroksi regilaul) eli niin kutsuttua kalevalamittaista kansanrunoutta on tallennettu, arkistoitu, järjestetty ja digitoitukin poikkeuksellisen paljon. Virolaisessa ERAB-korpuksess...

Full description

Bibliographic Details
Published in:Elore
Main Authors: Kallio, Kati, Janicki, Maciej, Mäkelä, Eetu, Saarinen, Jukka, Sarv, Mari, Saarlo, Liina
Other Authors: Kulttuurien osasto, Folkloristiikka, Digitaaliset ihmistieteet, Human Sciences – Computing Interaction, Helsinki Computational History Group, Digitaalisten ihmistieteiden osasto
Format: Article in Journal/Newspaper
Language:Finnish
Published: Suomen kansantietouden tutkijain seura 2023
Subjects:
Online Access:http://hdl.handle.net/10138/563652
id ftunivhelsihelda:oai:helda.helsinki.fi:10138/563652
record_format openpolar
spelling ftunivhelsihelda:oai:helda.helsinki.fi:10138/563652 2024-01-07T09:44:33+01:00 Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin Proceed with Care : A Critical Computational Perspective on Digital Folklore Corpora Kallio, Kati Janicki, Maciej Mäkelä, Eetu Saarinen, Jukka Sarv, Mari Saarlo, Liina Kulttuurien osasto Folkloristiikka Digitaaliset ihmistieteet Human Sciences – Computing Interaction Helsinki Computational History Group Digitaalisten ihmistieteiden osasto 2023-08-01T08:41:02Z 32 application/pdf http://hdl.handle.net/10138/563652 fin fin Suomen kansantietouden tutkijain seura 10.30666/elore.126008 Kallio , K , Janicki , M , Mäkelä , E , Saarinen , J , Sarv , M & Saarlo , L 2023 , ' Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin ' , Elore , Vuosikerta. 30 , Nro 1 , Sivut 59–90 . https://doi.org/10.30666/elore.126008 ORCID: /0000-0002-3673-1409/work/139918109 ORCID: /0000-0002-8366-8414/work/139919053 529fbc66-13c7-4c87-9245-3591f01fcd52 http://hdl.handle.net/10138/563652 openAccess info:eu-repo/semantics/openAccess 6160 Muut humanistiset tieteet Folkloristiikka kansanrunousarkistot tutkimusmenetelmät 113 Tietojenkäsittely- ja informaatiotieteet Artikkeli publishedVersion 2023 ftunivhelsihelda 2023-12-14T00:04:09Z Historiallisista, Suomen ja Viron kansallisvaltioiden syntyyn liittyvistä syistä johtuen itämerensuomalaista runolaulua (viroksi regilaul) eli niin kutsuttua kalevalamittaista kansanrunoutta on tallennettu, arkistoitu, järjestetty ja digitoitukin poikkeuksellisen paljon. Virolaisessa ERAB-korpuksessa ja suomalaisissa SKVR- ja JR-korpuksissa on tällä hetkellä 283 206 pääosin runolauluun liittyvää tekstiä viron (sis. seto), karjalan, lyydin, inkeroisen, vatjan ja suomen kielillä. Tässä artikkelissa analysoimme näiden korpusten määrällisiä perusominaisuuksia. Luomme ensin yleiskuvaa aineistojen järjestely- ja digitointihistoriasta ja kerromme, miten olemme FILTER-hankkeessa käsitelleet sähköisiä korpuksia. Sitten tarkastelemme aineiston ja tallennushistorian luonteeseen liittyviä määrällisiä perusominaisuuksia ja lopuksi työn aikana paljastuneita aineiston ja sen metatietojen ongelmakohtia, joista on hyvä olla tietoinen myös laadullista tutkimusta tehtäessä. Itämerensuomalaisen runolaulun sähköisessä muodossa oleva lähdeaineisto ei ole tasaista, kaikilta osiltaan systemaattista tai kattavaa, ja siinä on yllättäviäkin historian eri vaiheissa syntyneitä painotuksia ja ongelmia. Monet näistä ovat tiedossa aiemman tutkimuksen pohjalta, mutta laskennalliset menetelmät luovat aineistoon myös uusia näkökulmia. Samaan aikaan aineiston ongelmat vääristävät helposti erilaisia laskentoja, visualisointeja ja tulkintoja. Onkin tärkeää, että tutkijat myös sähköisiä välineitä käyttäessään lukevat yksittäisiä tekstejä, suhtautuvat aineiston metatietoihin varauksella ja osaavat tarvittaessa hakeutua alkuperäisten muistiinpanojen tai laajemman arkistoaineiston pariin. For historical reasons relating to the building of the Finnish and Estonian nations, Finnic oral poetry has been recorded, archived, curated and digitised in exceptional amounts. A similar poetic system was in use in Estonian, Votic, Ingrian, Karelian, Lydic, and Finnish. Altogether, there are currently 283,206 Finnic texts available in digital form in the Estonian ... Article in Journal/Newspaper karelian votic HELDA – University of Helsinki Open Repository Elore 30 1
institution Open Polar
collection HELDA – University of Helsinki Open Repository
op_collection_id ftunivhelsihelda
language Finnish
topic 6160 Muut humanistiset tieteet
Folkloristiikka
kansanrunousarkistot
tutkimusmenetelmät
113 Tietojenkäsittely- ja informaatiotieteet
spellingShingle 6160 Muut humanistiset tieteet
Folkloristiikka
kansanrunousarkistot
tutkimusmenetelmät
113 Tietojenkäsittely- ja informaatiotieteet
Kallio, Kati
Janicki, Maciej
Mäkelä, Eetu
Saarinen, Jukka
Sarv, Mari
Saarlo, Liina
Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
topic_facet 6160 Muut humanistiset tieteet
Folkloristiikka
kansanrunousarkistot
tutkimusmenetelmät
113 Tietojenkäsittely- ja informaatiotieteet
description Historiallisista, Suomen ja Viron kansallisvaltioiden syntyyn liittyvistä syistä johtuen itämerensuomalaista runolaulua (viroksi regilaul) eli niin kutsuttua kalevalamittaista kansanrunoutta on tallennettu, arkistoitu, järjestetty ja digitoitukin poikkeuksellisen paljon. Virolaisessa ERAB-korpuksessa ja suomalaisissa SKVR- ja JR-korpuksissa on tällä hetkellä 283 206 pääosin runolauluun liittyvää tekstiä viron (sis. seto), karjalan, lyydin, inkeroisen, vatjan ja suomen kielillä. Tässä artikkelissa analysoimme näiden korpusten määrällisiä perusominaisuuksia. Luomme ensin yleiskuvaa aineistojen järjestely- ja digitointihistoriasta ja kerromme, miten olemme FILTER-hankkeessa käsitelleet sähköisiä korpuksia. Sitten tarkastelemme aineiston ja tallennushistorian luonteeseen liittyviä määrällisiä perusominaisuuksia ja lopuksi työn aikana paljastuneita aineiston ja sen metatietojen ongelmakohtia, joista on hyvä olla tietoinen myös laadullista tutkimusta tehtäessä. Itämerensuomalaisen runolaulun sähköisessä muodossa oleva lähdeaineisto ei ole tasaista, kaikilta osiltaan systemaattista tai kattavaa, ja siinä on yllättäviäkin historian eri vaiheissa syntyneitä painotuksia ja ongelmia. Monet näistä ovat tiedossa aiemman tutkimuksen pohjalta, mutta laskennalliset menetelmät luovat aineistoon myös uusia näkökulmia. Samaan aikaan aineiston ongelmat vääristävät helposti erilaisia laskentoja, visualisointeja ja tulkintoja. Onkin tärkeää, että tutkijat myös sähköisiä välineitä käyttäessään lukevat yksittäisiä tekstejä, suhtautuvat aineiston metatietoihin varauksella ja osaavat tarvittaessa hakeutua alkuperäisten muistiinpanojen tai laajemman arkistoaineiston pariin. For historical reasons relating to the building of the Finnish and Estonian nations, Finnic oral poetry has been recorded, archived, curated and digitised in exceptional amounts. A similar poetic system was in use in Estonian, Votic, Ingrian, Karelian, Lydic, and Finnish. Altogether, there are currently 283,206 Finnic texts available in digital form in the Estonian ...
author2 Kulttuurien osasto
Folkloristiikka
Digitaaliset ihmistieteet
Human Sciences – Computing Interaction
Helsinki Computational History Group
Digitaalisten ihmistieteiden osasto
format Article in Journal/Newspaper
author Kallio, Kati
Janicki, Maciej
Mäkelä, Eetu
Saarinen, Jukka
Sarv, Mari
Saarlo, Liina
author_facet Kallio, Kati
Janicki, Maciej
Mäkelä, Eetu
Saarinen, Jukka
Sarv, Mari
Saarlo, Liina
author_sort Kallio, Kati
title Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
title_short Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
title_full Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
title_fullStr Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
title_full_unstemmed Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
title_sort eteneminen omalla vastuulla : lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
publisher Suomen kansantietouden tutkijain seura
publishDate 2023
url http://hdl.handle.net/10138/563652
genre karelian
votic
genre_facet karelian
votic
op_relation 10.30666/elore.126008
Kallio , K , Janicki , M , Mäkelä , E , Saarinen , J , Sarv , M & Saarlo , L 2023 , ' Eteneminen omalla vastuulla : Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin ' , Elore , Vuosikerta. 30 , Nro 1 , Sivut 59–90 . https://doi.org/10.30666/elore.126008
ORCID: /0000-0002-3673-1409/work/139918109
ORCID: /0000-0002-8366-8414/work/139919053
529fbc66-13c7-4c87-9245-3591f01fcd52
http://hdl.handle.net/10138/563652
op_rights openAccess
info:eu-repo/semantics/openAccess
container_title Elore
container_volume 30
container_issue 1
_version_ 1787425958811140096