Siirry pääsisältöön

Nykypäivän Sammot takovat uudenlaisia yhteyksiä tietojen välille

Nykypäivän Sammot takovat uudenlaisia yhteyksiä tietojen välille

”Uskoakseni digitaalisten ihmistieteiden ja linkitetyn avoimen datan avioliitto on monin tavoin onnellinen”, tiivistää Aalto-yliopiston viestintätekniikan professori ja Helsingin yliopiston digitaalisten ihmistieteiden osaston tutkimusjohtaja Eero Hyvönen pääasiat kahden viime vuosikymmenen työstään.

Asiaa voi jokainen helposti itse kokeilla. Avoimeen dataan ja semanttisiin linkityksiin perustuvien Sampo-portaalien avulla käyttäjät pystyvät hakemaan valtavista tietovarannoista monenlaista ristiin linkitettyä tietoa. Merkityksiin ja logiikkaan perustuva semanttinen web laajentaa ja rikastaa tiedonhakua perinteiseen internetiin verrattuna.

Eero Hyvönen

Eero Hyvönen

Kirjallisuus ja sotahistoria kiinnostavat

Tähänastisista Sampo-tietokannoista satunnainen suomalainen lienee todennäköisimmin törmännyt Kirjasampoon. Kirjastojen valtakunnallisessa kirjallisuuden verkkopalvelussa haki viime vuonna tietoa kirjoista ja kirjailijoista noin kaksi miljoonaa käyttäjää.

”Kirjasampo on jo muutaman vuoden elänyt omaa elämäänsä. Sillä on nykyään oma itsenäinen ylläpitokin”, Eero Hyvönen toteaa.

Kirjasampoa seuraa käyttäjämäärissä Sotasampo, joka koostuu talvisodan, jatkosodan ja Lapin sodan aineistoista. Sen kautta moni on selvitellyt edesmenneiden omaistensa sotakokemuksia ja törmännyt esimerkiksi saman joukko-osaston tapahtumista kertoviin sotapäiväkirjoihin tai valokuviin. Runsaasti käyttäjiä on myös vuosien 1914–1922 konflikteista kertovalla Sotasurmasammolla ja suomalaisista paikannimistä koostuvalla Nimisammolla.

Ristiin linkittäminen rikastaa sisältöjä

Sammoissa on Eero Hyvösen mukaan aina kolme puolta. Avoimet Sampo-tietokannat mahdollistavat digitaalisten ihmistieteiden tutkimusta, niitä voidaan käyttää sovelluskehitykseen, ja valmiiden käyttöliittymien ansiosta tietoja pystyy kuka tahansa hakemaan ja hyödyntämään monipuolisesti.

Kymmenkunnan tietotekniikan tutkijan ohella Sampo-hankkeissa on aina mukana eri alojen humanisteja, kuten kielitieteilijöitä ja historioitsijoita. Akateemisen monialaisuuden lisäksi tärkeitä ovat ennestään olemassa olevat tietokannat: esimerkiksi Kirjasampo pohjautuu suurelta osin Helmet-kirjastotietokantaan ja Sotasampo Kansallisarkiston sekä puolustusvoimien aineistoihin.

”Isoissa aineistoissa linkitykset täytyy tehdä mahdollisimman automaattisesti, mutta ne perustuvat jo aiemmin käsin tehtyihin aineistoihin, kuten kirjasto- ja museotietokantoihin. Olemassa olevia aineistoja muokataan ja rikastetaan niihin liittyvillä toisilla aineistoilla”, Hyvönen kuvailee.

Itse hän kertoo päätyneensä Sampojen pariin osin sattumalta.

”Olen aina ollut renessanssi-ihminen, kiinnostunut monista asioista. Vuonna 2001 etsin itselleni uutta tutkimusaluetta, ja semanttisen webin nousu alkoi juuri niihin aikoihin. Olen tekoälyn tutkija, ja kuvioihin tuli luontevasti mukaan semantiikan ja klassisen logiikan hyödyntäminen digitaalisissa ihmistieteissä.”

Kuvankaappauksessa käyttäjä on suodattanut esiin fasettihaulla Suomen suuriruhtinaskunnan kenraalit ja amiraalit (vasemmalla) ja saman aikakauden papiston (oikealla)

Biografiasammon avulla voi tutkia ja vertailla paitsi yksittäisiä henkilöitä, myös henkilöryhmiä. Kuvankaappauksessa käyttäjä on suodattanut esiin fasettihaulla Suomen suuriruhtinaskunnan kenraalit ja amiraalit (vasemmalla) ja saman aikakauden papiston (oikealla). Ryhmien elämäkaaret on visualisoitu sini-punaisina kaarina syntymäpaikasta kuolinpaikkaan. Muutamalla hiiren klikkauksella selviää, että korkea-arvoiset sotilaat muuttivat vanhempina usein etelään kuten eläkeläiset nykyään, mutta papisto pysytteli enempi suuriruhtinaskunnassa.

Sampojen perhe kasvaa jatkuvasti

Eero Hyvösen mukaan meneillään on erityisen vilkas Sampo-vuosi. Vuoden 2020 lopulla julkaistiin toistaiseksi isoin Sampo, yli 220 000 keskiaikaiseen käsikirjoitukseen perustuva MMM-datapalvelu, jonka Suomen osuutta rahoitti Suomen Akatemia.

Etenkin sukututkijoiden odotetaan hyödyntävän ahkerasti Runebergin päivänä julkaistua tuoreinta tulokasta. Turun akatemian ja Helsingin yliopiston vuosien 1640–1899 matrikkeleihin pohjautuvassa Akatemiasammossa voi tarkastella noin 28 000 opiskelijan elämänkulkuja ja keskinäisiä yhteyksiä, ja ristiinlinkitys Suomalaisen Kirjallisuuden Seuran elämäkertoihin perustuvan Biografiasammon kanssa tuo siihen lisää kulttuurihistoriallisia ulottuvuuksia.

”Toukokuussa julkistetaan metallinetsijöiden löydöksiä esittelevä Löytösampo. Suomen Akatemian rahoittamassa hankkeessa on ollut mukana arkeologeja Helsingin yliopistosta ja Museovirastosta sekä tekninen tiimi Aalto-yliopistosta”, Hyvönen kertoo.

Testikäytössä on oikeusministeriön kanssa kehitetty Lakisampo, joka sisältää muun muassa valtion säädöstietopankki Finlexistä peräisin olevia lakiaineistoja ja oikeustapauksia. Julkaisemista odottaa myös kansainvälinen Kirjesampo, jonka prototyyppi sisältää noin 160 000 valistusajan kirjettä Galileo Galileista 1800-luvun alkuun.

Suomen Akatemia rahoittaa parhaillaan myös Parlamenttisampoa, joka sisältää eduskunnan täysistuntojen pöytäkirjat sekä kansanedustajatiedot vuodesta 1907 lähtien. Vastaisuudessa sen avulla voidaan Hyvösen mukaan tutkia Suomen poliittista kulttuuria ja kielenkäyttöä sekä poliitikkojen verkostoja.

”Sampojen Sampo” on jo suunnitteilla

Seuraava askel Sampojen kehityksessä on vuorovaikutteisuuden lisääminen palautekanavan avulla.

”Jo nyt esimerkiksi Sotasammon käyttäjiltä on tullut Kansallisarkiston dataan satoja korjaus- ja täydennysehdotuksia. Tulevaisuudessa tarkoitus on, että jos esimerkiksi isoisä on ollut rintamalla, niin hänen kirjeitään ja valokuviaan voisi ladata Sotasampoon ja rikastaa sillä tavalla sisältöä”, Eero Hyvönen kertoo.

Mielessä herää myös kysymys, olisiko olemassa olevia Sampoja kenties mahdollista yhdistää nykyistäkin laajemmin.

”Kyllä suunnitteilla on myös 'Samposampo', joka yhdistää kaikki tähänastiset Sammot toisiinsa. Sen keskiössä tulevat olemaan historialliset tapahtumat, joihin erilaiset aineistot linkittyvät”, Hyvönen lupaa.

Täältä löydät Sammot:

Akatemiasampo
Biografiasampo 
Kirjasampo
Kulttuurisampo
Nimisampo
Sotasampo
Sotasurmasampo

Teksti: Anna Dannenberg
Kuvat: Aino Huovio, Aalto-yliopisto

Tämä haastattelu on osa Tietysti.fi-sivuston Tutkitun tiedon teemavuoden juttusarjaa. Esittelemme sarjassa Suomen Akatemian rahoittamia tutkijoita, jotka eri tavoin välittävät tai hyödyntävät tutkittua tietoa tutkimuksen ulkopuolella. Esittelemme joka kuukausi eri alan tutkijan.

Viimeksi muokattu 25.2.2021

Tietysti.fi on Suomen Akatemian sivusto, joka kertoo yleistajuisesti Akatemian rahoittamasta tutkimuksesta.  Sivuille kootaan muun muassa tutkijahaastatteluita, tieteen yleisötapahtumia, tiedeuutisia ja tutkimuksesta kertovia taustajuttuja.

Seuraa meitä:
 
Facebook logo  Twitter logo  Youtube logo

Ota yhteyttä

Suomen Akatemian viestintä
viestinta@aka.fi

Suomen Akatemian logo

Lisätietoja Suomen Akatemiasta www.aka.fi

SAAVUTETTAVUUS