Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa
Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Arti...
Main Author: | |
---|---|
Other Authors: | , |
Format: | Other/Unknown Material |
Language: | Finnish |
Published: |
2023
|
Subjects: | |
Online Access: | https://www.doria.fi/handle/10024/188016 |
id |
ftdoria:oai:www.doria.fi:10024/188016 |
---|---|
record_format |
openpolar |
spelling |
ftdoria:oai:www.doria.fi:10024/188016 2023-11-12T04:27:10+01:00 Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa Leppänen, Timo fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University| fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare| 2023 71 fulltext true https://www.doria.fi/handle/10024/188016 fin fin https://www.doria.fi/handle/10024/188016 URN:NBN:fi-fe20231030141965 fi=Teos on tarkoitettu opetus- ja tutkimus- sekä yksityiseen käyttöön voimassa olevien tekijänoikeuslain säädösten mukaan. Teoksen kaupallinen hyödyntäminen on kielletty|en=The work is intended for educational and research as well as private use in accordance with the provisions in force of the Copyright Act. Using the work for commercial purposes is prohibited.| NLP kvantitatiivinen tekstianalyysi venäjän kieli tekstianalyysi korpuslingvistiikka luonnollisen kielen käsittely digital humanities tekstintutkimus mallintaminen fi=strategia|sv=Strategi|en=Strategy| fi=Diplomityö (YE)|sv=Licentiatavhandling|en=Licentiate thesis| 2023 ftdoria 2023-11-02T00:07:03Z Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Artikkelien tekstisisältöä prosessoitiin neljässä eri vaiheessa. Venäjänkielinen sanasto palautettiin perusmuotoihin koneoppivalla UDPipe-ohjelmalla hyödyntäen Taiga-opetusaineistoa. Tutkimuksessa tarkasteltiin lehden aktiivisimpia kirjoittajia sekä teemallisia osioita. Kolme aktiivisinta kirjoittajaa 2000-luvulla ovat olleet elektroniseen sodankäyntiin keskittynyt Juri Donskov, sekä yleisestä taktiikasta laajasti kirjoittaneet Ivan Vorobjev ja Valeri Kiselev. Lehden teemaosioista geopolitiikan osuus oli noussut havaittavasti vuoden 2007 jälkeen. Lehden teemojen ja niiden artikkelien sisältöä sanastoa tarkasteltiin frekvenssin ja avainsanaanalyysin kautta. Aineistoa prosessointi sekä rajaus vain adjektiiveihin ja substantiiveihin paransivat tulosten ymmärrettävyyttä merkittävästi. Lehden teemojen avainsanojen määrittelyyn käytettiin tf-idf-tunnuslukua ja Juri Donskovin tuotantoon keyness-menetelmää. Molemmat soveltuivat hyvin sisällön yleiseen kuvaamiseen. Kolmannessa osassa tarkasteltiin yksittäisten termien sanafrekvenssiä ja yleisimpiä kollokaatteja. Esimerkkinä tarkasteltiin strategisen operaation käsitteen esiintymistä yli ajan sekä siihen liitettyä sanakontekstia suhteessa sanakirjamääritelmään. Toisena esimerkkinä tarkasteltiin Ofer Fridmanin esiin nostamia kuutta valkoisen Venäjän klassikkokirjoittajaa. Heistä Genrikh Leer ja Nikolai Golovin ovat esiintyneet lehdessä useimmin 2000-luvulla. Viimeiseksi tarkasteltiin geopolitiikka-teemasta noussutta USA-lyhennettä, jonka todettiin liite tyn vuoden 2008 jälkeen tiiviisti Natoon. Sotataidon tutkimus perustuu usein erilaisten tekstien analyysiin. Kvantitatiivisilla menetelmillä on mahdollisuus lähestyä entistä laajempia aineistoja. Ne eivät kuitenkaan poista tarvetta ... Other/Unknown Material taiga Doria (National Library of Finland) |
institution |
Open Polar |
collection |
Doria (National Library of Finland) |
op_collection_id |
ftdoria |
language |
Finnish |
topic |
NLP kvantitatiivinen tekstianalyysi venäjän kieli tekstianalyysi korpuslingvistiikka luonnollisen kielen käsittely digital humanities tekstintutkimus mallintaminen fi=strategia|sv=Strategi|en=Strategy| |
spellingShingle |
NLP kvantitatiivinen tekstianalyysi venäjän kieli tekstianalyysi korpuslingvistiikka luonnollisen kielen käsittely digital humanities tekstintutkimus mallintaminen fi=strategia|sv=Strategi|en=Strategy| Leppänen, Timo Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
topic_facet |
NLP kvantitatiivinen tekstianalyysi venäjän kieli tekstianalyysi korpuslingvistiikka luonnollisen kielen käsittely digital humanities tekstintutkimus mallintaminen fi=strategia|sv=Strategi|en=Strategy| |
description |
Tutkimuksen tarkoituksena oli kartoittaa kvantitatiivisten tekstianalyysin menetelmien käytettävyyttä venäläisen sotataidon tutkimuksessa. Työssä koottiin tutkimusaineisto johtavasta sotatieteellisestä Vojennaja mysl-aikakauslehdestä. Aineistoon sisältyi noin 2800 artikkelia vuosilta 2000–2020. Artikkelien tekstisisältöä prosessoitiin neljässä eri vaiheessa. Venäjänkielinen sanasto palautettiin perusmuotoihin koneoppivalla UDPipe-ohjelmalla hyödyntäen Taiga-opetusaineistoa. Tutkimuksessa tarkasteltiin lehden aktiivisimpia kirjoittajia sekä teemallisia osioita. Kolme aktiivisinta kirjoittajaa 2000-luvulla ovat olleet elektroniseen sodankäyntiin keskittynyt Juri Donskov, sekä yleisestä taktiikasta laajasti kirjoittaneet Ivan Vorobjev ja Valeri Kiselev. Lehden teemaosioista geopolitiikan osuus oli noussut havaittavasti vuoden 2007 jälkeen. Lehden teemojen ja niiden artikkelien sisältöä sanastoa tarkasteltiin frekvenssin ja avainsanaanalyysin kautta. Aineistoa prosessointi sekä rajaus vain adjektiiveihin ja substantiiveihin paransivat tulosten ymmärrettävyyttä merkittävästi. Lehden teemojen avainsanojen määrittelyyn käytettiin tf-idf-tunnuslukua ja Juri Donskovin tuotantoon keyness-menetelmää. Molemmat soveltuivat hyvin sisällön yleiseen kuvaamiseen. Kolmannessa osassa tarkasteltiin yksittäisten termien sanafrekvenssiä ja yleisimpiä kollokaatteja. Esimerkkinä tarkasteltiin strategisen operaation käsitteen esiintymistä yli ajan sekä siihen liitettyä sanakontekstia suhteessa sanakirjamääritelmään. Toisena esimerkkinä tarkasteltiin Ofer Fridmanin esiin nostamia kuutta valkoisen Venäjän klassikkokirjoittajaa. Heistä Genrikh Leer ja Nikolai Golovin ovat esiintyneet lehdessä useimmin 2000-luvulla. Viimeiseksi tarkasteltiin geopolitiikka-teemasta noussutta USA-lyhennettä, jonka todettiin liite tyn vuoden 2008 jälkeen tiiviisti Natoon. Sotataidon tutkimus perustuu usein erilaisten tekstien analyysiin. Kvantitatiivisilla menetelmillä on mahdollisuus lähestyä entistä laajempia aineistoja. Ne eivät kuitenkaan poista tarvetta ... |
author2 |
fi=Maanpuolustuskorkeakoulu|sv=Försvarshögskolan|en=National Defence University| fi=Sotataidon laitos|sv=Institutionen för krigskonst|en=Department of Warfare| |
format |
Other/Unknown Material |
author |
Leppänen, Timo |
author_facet |
Leppänen, Timo |
author_sort |
Leppänen, Timo |
title |
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
title_short |
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
title_full |
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
title_fullStr |
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
title_full_unstemmed |
Kvantitatiivinen tekstianalyysi Venäläisen sotataidon tutkimuksessa |
title_sort |
kvantitatiivinen tekstianalyysi venäläisen sotataidon tutkimuksessa |
publishDate |
2023 |
url |
https://www.doria.fi/handle/10024/188016 |
genre |
taiga |
genre_facet |
taiga |
op_relation |
https://www.doria.fi/handle/10024/188016 URN:NBN:fi-fe20231030141965 |
op_rights |
fi=Teos on tarkoitettu opetus- ja tutkimus- sekä yksityiseen käyttöön voimassa olevien tekijänoikeuslain säädösten mukaan. Teoksen kaupallinen hyödyntäminen on kielletty|en=The work is intended for educational and research as well as private use in accordance with the provisions in force of the Copyright Act. Using the work for commercial purposes is prohibited.| |
_version_ |
1782340872111652864 |