Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa

Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Arti...

Full description

Bibliographic Details
Main Author: Leppänen, Timo
Other Authors: fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University|, fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare|
Format: Other/Unknown Material
Language:Finnish
Published: 2023
Subjects:
NLP
Online Access:https://www.doria.fi/handle/10024/188016
id ftdoria:oai:www.doria.fi:10024/188016
record_format openpolar
spelling ftdoria:oai:www.doria.fi:10024/188016 2023-11-12T04:27:10+01:00 Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa Leppänen, Timo fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University| fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare| 2023 71 fulltext true https://www.doria.fi/handle/10024/188016 fin fin https://www.doria.fi/handle/10024/188016 URN:NBN:fi-fe20231030141965 fi=Teos on tarkoitettu opetus- ja tutkimus- sekä yksityiseen käyttöön voimassa olevien tekijänoikeuslain säädösten mukaan. Teoksen kaupallinen hyödyntäminen on kielletty|en=The work is intended for educational and research as well as private use in accordance with the provisions in force of the Copyright Act. Using the work for commercial purposes is prohibited.| NLP kvantitatiivinen tekstianalyysi venäjän kieli tekstianalyysi korpuslingvistiikka luonnollisen kielen käsittely digital humanities tekstintutkimus mallintaminen fi=strategia|sv=Strategi|en=Strategy| fi=Diplomityö (YE)|sv=Licentiatavhandling|en=Licentiate thesis| 2023 ftdoria 2023-11-02T00:07:03Z Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Artikkelien tekstisisältöä prosessoitiin neljässä eri vaiheessa. Venäjänkielinen sanasto palautettiin perusmuotoihin koneoppivalla UDPipe-ohjelmalla hyödyntäen Taiga-opetusaineistoa. Tutkimuksessa tarkasteltiin lehden aktiivisimpia kirjoittajia sekä teemallisia osioita. Kolme aktiivisinta kirjoittajaa 2000-luvulla ovat olleet elektroniseen sodankäyntiin keskittynyt Juri Donskov, sekä yleisestä taktiikasta laajasti kirjoittaneet Ivan Vorobjev ja Valeri Kiselev. Lehden teemaosioista geopolitiikan osuus oli noussut havaittavasti vuoden 2007 jälkeen. Lehden teemojen ja niiden artikkelien sisältöä sanastoa tarkasteltiin frekvenssin ja avainsanaanalyysin kautta. Aineistoa prosessointi sekä rajaus vain adjektiiveihin ja substantiiveihin paransivat tulosten ymmärrettävyyttä merkittävästi. Lehden teemojen avainsanojen määrittelyyn käytettiin tf-idf-tunnuslukua ja Juri Donskovin tuotantoon keyness-menetelmää. Molemmat soveltuivat hyvin sisällön yleiseen kuvaamiseen. Kolmannessa osassa tarkasteltiin yksittäisten termien sanafrekvenssiä ja yleisimpiä kollokaatteja. Esimerkkinä tarkasteltiin strategisen operaation käsitteen esiintymistä yli ajan sekä siihen liitettyä sanakontekstia suhteessa sanakirjamääritelmään. Toisena esimerkkinä tarkasteltiin Ofer Fridmanin esiin nostamia kuutta valkoisen Venäjän klassikkokirjoittajaa. Heistä Genrikh Leer ja Nikolai Golovin ovat esiintyneet lehdessä useimmin 2000-luvulla. Viimeiseksi tarkasteltiin geopolitiikka-teemasta noussutta USA-lyhennettä, jonka todettiin liite tyn vuoden 2008 jälkeen tiiviisti Natoon. Sotataidon tutkimus perustuu usein erilaisten tekstien analyysiin. Kvantitatiivisilla menetelmillä on mahdollisuus lähestyä entistä laajempia aineistoja. Ne eivät kuitenkaan poista tarvetta ... Other/Unknown Material taiga Doria (National Library of Finland)
institution Open Polar
collection Doria (National Library of Finland)
op_collection_id ftdoria
language Finnish
topic NLP
kvantitatiivinen tekstianalyysi
venäjän kieli
tekstianalyysi
korpuslingvistiikka
luonnollisen kielen käsittely
digital humanities
tekstintutkimus
mallintaminen
fi=strategia|sv=Strategi|en=Strategy|
spellingShingle NLP
kvantitatiivinen tekstianalyysi
venäjän kieli
tekstianalyysi
korpuslingvistiikka
luonnollisen kielen käsittely
digital humanities
tekstintutkimus
mallintaminen
fi=strategia|sv=Strategi|en=Strategy|
Leppänen, Timo
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
topic_facet NLP
kvantitatiivinen tekstianalyysi
venäjän kieli
tekstianalyysi
korpuslingvistiikka
luonnollisen kielen käsittely
digital humanities
tekstintutkimus
mallintaminen
fi=strategia|sv=Strategi|en=Strategy|
description Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Artikkelien tekstisisältöä prosessoitiin neljässä eri vaiheessa. Venäjänkielinen sanasto palautettiin perusmuotoihin koneoppivalla UDPipe-ohjelmalla hyödyntäen Taiga-opetusaineistoa. Tutkimuksessa tarkasteltiin lehden aktiivisimpia kirjoittajia sekä teemallisia osioita. Kolme aktiivisinta kirjoittajaa 2000-luvulla ovat olleet elektroniseen sodankäyntiin keskittynyt Juri Donskov, sekä yleisestä taktiikasta laajasti kirjoittaneet Ivan Vorobjev ja Valeri Kiselev. Lehden teemaosioista geopolitiikan osuus oli noussut havaittavasti vuoden 2007 jälkeen. Lehden teemojen ja niiden artikkelien sisältöä sanastoa tarkasteltiin frekvenssin ja avainsanaanalyysin kautta. Aineistoa prosessointi sekä rajaus vain adjektiiveihin ja substantiiveihin paransivat tulosten ymmärrettävyyttä merkittävästi. Lehden teemojen avainsanojen määrittelyyn käytettiin tf-idf-tunnuslukua ja Juri Donskovin tuotantoon keyness-menetelmää. Molemmat soveltuivat hyvin sisällön yleiseen kuvaamiseen. Kolmannessa osassa tarkasteltiin yksittäisten termien sanafrekvenssiä ja yleisimpiä kollokaatteja. Esimerkkinä tarkasteltiin strategisen operaation käsitteen esiintymistä yli ajan sekä siihen liitettyä sanakontekstia suhteessa sanakirjamääritelmään. Toisena esimerkkinä tarkasteltiin Ofer Fridmanin esiin nostamia kuutta valkoisen Venäjän klassikkokirjoittajaa. Heistä Genrikh Leer ja Nikolai Golovin ovat esiintyneet lehdessä useimmin 2000-luvulla. Viimeiseksi tarkasteltiin geopolitiikka-teemasta noussutta USA-lyhennettä, jonka todettiin liite tyn vuoden 2008 jälkeen tiiviisti Natoon. Sotataidon tutkimus perustuu usein erilaisten tekstien analyysiin. Kvantitatiivisilla menetelmillä on mahdollisuus lähestyä entistä laajempia aineistoja. Ne eivät kuitenkaan poista tarvetta ...
author2 fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University|
fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare|
format Other/Unknown Material
author Leppänen, Timo
author_facet Leppänen, Timo
author_sort Leppänen, Timo
title Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
title_short Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
title_full Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
title_fullStr Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
title_full_unstemmed Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
title_sort kvantitatiivinen tekstianalyysi venäläisen sotataidon tutkimuksessa
publishDate 2023
url https://www.doria.fi/handle/10024/188016
genre taiga
genre_facet taiga
op_relation https://www.doria.fi/handle/10024/188016
URN:NBN:fi-fe20231030141965
op_rights fi=Teos on tarkoitettu opetus- ja tutkimus- sekä yksityiseen käyttöön voimassa olevien tekijänoikeuslain säädösten mukaan. Teoksen kaupallinen hyödyntäminen on kielletty|en=The work is intended for educational and research as well as private use in accordance with the provisions in force of the Copyright Act. Using the work for commercial purposes is prohibited.|
_version_ 1782340872111652864