Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa

Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Arti...

Full description

Bibliographic Details
Main Author: Leppänen, Timo
Other Authors: fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University|, fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare|
Format: Other/Unknown Material
Language:Finnish
Published: 2023
Subjects:
NLP
Online Access:https://www.doria.fi/handle/10024/188016
Description
Summary:Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Artikkelien tekstisisältöä prosessoitiin neljässä eri vaiheessa. Venäjänkielinen sanasto palautettiin perusmuotoihin koneoppivalla UDPipe-ohjelmalla hyödyntäen Taiga-opetusaineistoa. Tutkimuksessa tarkasteltiin lehden aktiivisimpia kirjoittajia sekä teemallisia osioita. Kolme aktiivisinta kirjoittajaa 2000-luvulla ovat olleet elektroniseen sodankäyntiin keskittynyt Juri Donskov, sekä yleisestä taktiikasta laajasti kirjoittaneet Ivan Vorobjev ja Valeri Kiselev. Lehden teemaosioista geopolitiikan osuus oli noussut havaittavasti vuoden 2007 jälkeen. Lehden teemojen ja niiden artikkelien sisältöä sanastoa tarkasteltiin frekvenssin ja avainsanaanalyysin kautta. Aineistoa prosessointi sekä rajaus vain adjektiiveihin ja substantiiveihin paransivat tulosten ymmärrettävyyttä merkittävästi. Lehden teemojen avainsanojen määrittelyyn käytettiin tf-idf-tunnuslukua ja Juri Donskovin tuotantoon keyness-menetelmää. Molemmat soveltuivat hyvin sisällön yleiseen kuvaamiseen. Kolmannessa osassa tarkasteltiin yksittäisten termien sanafrekvenssiä ja yleisimpiä kollokaatteja. Esimerkkinä tarkasteltiin strategisen operaation käsitteen esiintymistä yli ajan sekä siihen liitettyä sanakontekstia suhteessa sanakirjamääritelmään. Toisena esimerkkinä tarkasteltiin Ofer Fridmanin esiin nostamia kuutta valkoisen Venäjän klassikkokirjoittajaa. Heistä Genrikh Leer ja Nikolai Golovin ovat esiintyneet lehdessä useimmin 2000-luvulla. Viimeiseksi tarkasteltiin geopolitiikka-teemasta noussutta USA-lyhennettä, jonka todettiin liite tyn vuoden 2008 jälkeen tiiviisti Natoon. Sotataidon tutkimus perustuu usein erilaisten tekstien analyysiin. Kvantitatiivisilla menetelmillä on mahdollisuus lähestyä entistä laajempia aineistoja. Ne eivät kuitenkaan poista tarvetta ...