{"id":351,"date":"2016-09-09T08:00:26","date_gmt":"2016-09-09T05:00:26","guid":{"rendered":"http:\/\/www.glossa.fi\/wp\/?p=351"},"modified":"2016-09-06T09:59:24","modified_gmt":"2016-09-06T06:59:24","slug":"propreau-tuntemattoman-tekijan-metsastys","status":"publish","type":"post","link":"https:\/\/www.glossa.fi\/wp\/?p=351","title":{"rendered":"PROPREAU: tuntemattoman tekij\u00e4n mets\u00e4stys"},"content":{"rendered":"<p><em><span lang=\"fi-FI\">Reima V\u00e4lim\u00e4ki<\/span><\/em><\/p>\n<p><span lang=\"fi-FI\">Vuoden alusta, ja toden teolla t\u00e4n\u00e4 syksyn\u00e4, alkoi yksi Suomen Akatemian Digitaalisten Ihmistieteiden akatemiaohjelman rahoittamista konsortioista. Turun yliopiston kulttuurihistorian ja IT-laitoksen yhteishankkeessa tunnistetaan ja profiloidaan anonyymej\u00e4 kirjoittajia tai kirjoittajaryhmi\u00e4 antiikin ja keskiajan teksteist\u00e4. <\/span><\/p>\n<p><span lang=\"fi-FI\">Projektissa on kolme alahanketta, joissa tarkastellaan antiikin kielioppitekstej\u00e4, paavillisen kuurian dokumentteja syd\u00e4nkeskiajalla sek\u00e4 my\u00f6h\u00e4iskeskiaikaisia poleemisia tekstej\u00e4. Yhteisty\u00f6t\u00e4 tehd\u00e4\u00e4n ennen kaikkea Z\u00fcrichin yliopiston <em>Corpus Corporum<\/em> -tietokannan, <em>Monumenta Germaniae Historican<\/em> sek\u00e4 Wuppertalin yliopiston kanssa.<\/span><\/p>\n<p><span lang=\"fi-FI\">Tietokoneavusteisia menetelmi\u00e4 hy\u00f6dynt\u00e4v\u00e4 tekij\u00e4ntunnistus on vakiintunut nykyajan tekstien, esimerkiksi verkkokeskustelujen tutkimukseen, ja si<\/span><span lang=\"fi-FI\">ll\u00e4<\/span><span lang=\"fi-FI\"> on my\u00f6s rikosteknisi\u00e4 ja tiedustelusovelluksia. Esimodernien tekstien tunnistuksessa menetelm\u00e4t tekev\u00e4t vasta tuloaan, ja ensimm\u00e4iset merkitt\u00e4v\u00e4t tulokset ovat ilmestyneet aivan viime vuosina. Keskustelua k\u00e4yd\u00e4\u00e4n p\u00e4\u00e4asiassa digital humanities -julkaisuissa. <\/span><\/p>\n<p><span lang=\"fi-FI\">Yksi <em>Propreau<\/em>-hankkeen tavoitteista onkin kuroa umpeen kuilua digitaalisten menetelmien ja alan vakiintuneiden julkaisukanavien v\u00e4lill\u00e4. Tarkoituksena on tehd\u00e4 tietokoneavusteisista menetelmist\u00e4 yksi v\u00e4line lis\u00e4\u00e4 tutkijan ty\u00f6kalupakkiin, t\u00e4ydent\u00e4m\u00e4\u00e4n kodikologian, paleografian ja sis\u00e4lt\u00f6analyysin tuloksia. <\/span><\/p>\n<p><span lang=\"fi-FI\">Projektin toiminta-ajatuksena on, ettei kaikkien tarvitse osata kaikkea, eli hyvin toimivassa tutkimusryhm\u00e4ss\u00e4 kukin voi keskitty\u00e4 omaan erikoisalaansa. Kielen ja historian asiantuntijoiden ei v\u00e4ltt\u00e4m\u00e4tt\u00e4 tarvitse alkaa opetella ohjelmointia, vaan projektin j\u00e4senten taidot t\u00e4ydent\u00e4v\u00e4t toisiaan. Perinteisest\u00e4 humanistisesta tutkimuksesta poiketen k\u00e4yt\u00e4nn\u00f6ss\u00e4 kaikkea tehd\u00e4\u00e4n ryhm\u00e4ss\u00e4, ei yksin puurtaen.<\/span><\/p>\n<p><span lang=\"fi-FI\">Toinen ajattelun k\u00e4\u00e4nne, joka meid\u00e4n humanistien pit\u00e4\u00e4 tehd\u00e4, on ett\u00e4 meille rakkaista teksteist\u00e4 tulee merkkijonoja. Me olemme tottuneet analysoimaan sis\u00e4lt\u00f6\u00e4, mutta usein koneoppimista hy\u00f6dynt\u00e4v\u00e4ss\u00e4 tekij\u00e4ntunnistuksessa kaikki sis\u00e4lt\u00f6 h\u00e4ivytet\u00e4\u00e4n: sis\u00e4lt\u00f6sanoista kuten substantiiveista, adjektiiveista tai verbeist\u00e4 tulee vain sanaluokkien ja sijojen nimi\u00e4 kantavia tageja. Kone ei opi mist\u00e4 puhutaan va<\/span><span lang=\"fi-FI\">an<\/span><span lang=\"fi-FI\"> miten puhutaan. Kuulostaa hurjalta, mutta se mahdollistaa eri aiheita k\u00e4sittelevien tekstien vertaamisen. <\/span><\/p>\n<p><span lang=\"fi-FI\">Humanistien teht\u00e4v\u00e4ksi <\/span><span lang=\"fi-FI\">j\u00e4\u00e4 <\/span><span lang=\"fi-FI\">tehd\u00e4 tulkinnat ja palauttaa kaikki mielenkiintoinen sis\u00e4lt\u00f6 ja konteksti teoksiin ja tekij\u00f6ihin. <\/span><\/p>\n<p><span lang=\"fi-FI\">Lis\u00e4\u00e4:<br \/>\n<a href=\"http:\/\/www.aka.fi\/DIGIHUM\/\">DIGIHUM Akatemiaohjelma<\/a><br \/>\n<a href=\"https:\/\/blogit.utu.fi\/propreau\/\">PROPREAU -blogi<\/a><br \/>\n<a href=\"http:\/\/bionlp.utu.fi\/index.html\">Turku BioNLP Group<\/a><br \/>\n<a href=\"https:\/\/www.utu.fi\/fi\/sivustot\/digi\/Sivut\/home.aspx\">Digin \u2013 Digitaalisen vuorovaikutuksen tutkijaverkosto<\/a><br \/>\n<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Reima V\u00e4lim\u00e4ki Vuoden alusta, ja toden teolla t\u00e4n\u00e4 syksyn\u00e4, alkoi yksi Suomen Akatemian Digitaalisten Ihmistieteiden akatemiaohjelman rahoittamista konsortioista. Turun yliopiston kulttuurihistorian ja IT-laitoksen yhteishankkeessa tunnistetaan ja profiloidaan anonyymej\u00e4 kirjoittajia tai kirjoittajaryhmi\u00e4 antiikin ja keskiajan teksteist\u00e4. Projektissa on kolme alahanketta, joissa tarkastellaan antiikin kielioppitekstej\u00e4, paavillisen kuurian dokumentteja syd\u00e4nkeskiajalla sek\u00e4 my\u00f6h\u00e4iskeskiaikaisia poleemisia tekstej\u00e4. Yhteisty\u00f6t\u00e4 tehd\u00e4\u00e4n ennen kaikkea [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/posts\/351"}],"collection":[{"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=351"}],"version-history":[{"count":1,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/posts\/351\/revisions"}],"predecessor-version":[{"id":352,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=\/wp\/v2\/posts\/351\/revisions\/352"}],"wp:attachment":[{"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=351"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=351"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.glossa.fi\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=351"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}