12.7.2017

Mitä minusta tiedetään ja mihin tietoa käytetään?

Iso määrä päivittäistä digitietoa ja oikeat yhdistelmät. Siinä resepti, jolla tuotetaan tulevaisuudessa yksilöllisiä palveluja. Tavoitteena on myös, että ihminen saa itse päättää, millaista tietoa hän sallii itsestään jaettavaksi esimerkiksi kaupallisiin tarkoituksiin.   

Aamu alkaa surffailulla netissä, parilla tykkäyksellä kavereiden postauksiin ja omalla facepäivityksellä, johon on linkattu uutinen verkkolehdestä. Sen jälkeen älykortilla älybussiin, jossa matka taittuu älypuhelinta selailemalla. Sen jälkeen työhön, joka tehdään pääosin netissä jättäen hakukoneyhtiöille monia jälkiä. Ja illalla kauppaan, jossa kanta-asiakaskortti vilahtaa kassalla antaen alennuksen ja kertoo kauppaketjulle ja sen yhteistyökumppaneille ostoksistani. Kaupasta lähtiessä älypuhelin vielä kysyy, haluanko ilmoittaa sijaintini kavereille tai haluanko arvostella paikan, jossa juuri vierailin. En halua.

Päivän aikana ihmisestä syntyy jatkuvana virtana digitaalisia jälkiä, joita oikein yhdistelemällä voidaan saada hyödyllistä tietoa. Akatemiatutkija Arto Klami kehittää tekoälymenetelmiä, joilla erilaisista lähteistä peräisin olevaa, verkkoon hajautettua tietoa tiivistetään ja tarjotaan käyttäjälle räätälöitynä.

Omien tietojen hallintaoikeus

Kuulostaa yhtä aikaa sekä epäilyttävältä ’isoveli valvoo’-meiningiltä, että tervetulleelta tulevaisuudelta. Klami itse suhtautuu yksityisyyden suojaan käytännöllisesti, suuri osa tiedoistamme päätyy joka tapauksessa kansainvälisille mediajäteille. ”Itse toivon saavani älykästä ja juuri minulle räätälöityä palvelua sen tiedon pohjalta, mitä minusta kerätään.” Samalla hän toivoo, että tulevaisuudessa kertyvien aineistojen hallintaoikeus olisi ihmisellä itsellään. Niin, että ihminen itse saa päättää siitä, millaista tietoa hän sallii jaettavaksi itsestään eri tarkoituksiin. ”Tällaista on kehitteillä, mutta onnistuminen vaatii sekä teknologian että lainsäädännön yhtäaikaista kehittämistä.”

Digitiedon yhdistely

Mikä tutkimuksessa ja tavoitteissa on uutta? Dataa on paljon, ja suuri osa siitä syntyy päivittäisten askareidemme sivutuotteena. Sitä ei siis ole tuotettu vastaamaan suoraan räätälöityihin kysymyksiin, vaan datasta täytyy kaivaa esille kulloinkin tarvittava tieto. Projektissa kehitetään uudenlaisia koneoppimismenetelmiä yhdistämään eri lähteiden tarjoamaa tietoa. Joukkoliikenteestä saadaan tietoa eri reiteillä olevista matkustajista ja määristä. Sen tiedon yhdistäminen esimerkiksi Twitteriin kertoo, onko jossakin päin kaupunkia erityistä säpinää ja tapahtumia, jolloin tietyille linjoille voidaan lisätä vuoroja. Yhteistyötä on tehty jo yhden ranskalaisen joukkoliikennettä suunnittelevan yrityksen kanssa.

Yksi kiinnostuksen kohde on se, millä tavalla eri ihmiset käyttävät tietokonetta. ”Meillä on hyvin yksilöllisiä tottumuksia. Digijäljistä voi päätellä esimerkiksi sen, onko jonkun koneen käyttäjä vaihtunut välillä tai onko hän se, joka väittää olevansa.”

Ura alkoi tietokonepeleillä lukiossa

Arto Klami oli kiinnostunut tekoälystä jo lukiossa. ”Meillä oli kaveriporukka, joka teki muun muassa tietokonepelejä, joihin kaivattiin tekoälypelaajia. Oli aika luonnollista, että lähdin opiskelemaan informaatiotekniikkaa.”

Ala kehittyy tällä hetkellä kovaa vauhtia. ”Perustutkimuksen on oltava hyvin dataan sidottua ja kiinnostavaa on, että jo muutaman kuukauden kuluttua saadaan aina uusia tuloksia. Työskentely motivoi, kun työn jäljet näkyvät pian.” Alalle syntyy parhaillaan menetelmiä, joita voidaan soveltaa muissa tieteissä, kuten bioaloilla ja lääketieteessä. ”Yhteiskuntatieteet ovat olleet paitsiossa, vaikka niissäkin näkisin monia mahdollisuuksia soveltaa digitaalista dataa uudella tavalla.”

Pitääkö vetää foliohattua päähän?

Foliohattuilu digitiedonvälityksen ympärillä on vilkasta. Väitetään esimerkiksi, että maailman johtavat vakoiluorganisaatiot tarkkailevat satelliittipuheluita niin, että jonkin yksittäisen puhelussa käytetyn sanan jälkeen kuuntelu käynnistyy. Tätä urbaanilegendaa on kerrottu esimerkiksi 911-päivän jälkeen, luonnollisesti kuuntelun laukaisevat koodisanat liittyvät tässä tapauksessa terrorismiin. Ei ole totta, sanoo tutkija. ” Teknisesti tällaisten koodisanojen etsiminen alkaisi jo olla mahdollista, mutta itse keskustelujen sisällön seulomiseen tarvittaisiin vielä valtava määrä ihmisiä. Sitä paitsi on vaikea kuvitella, että esimerkiksi Elisa tai Sonera antaisivat tällä tavoin lupaa sotkeutua kuuntelemaan omia asiakkaitaan.”

Star Wars-robotit, R2D2 ja herrasmiespalvelija-droidi olivat vielä äskettäin tieteiselokuvan roolihahmoja. Joko niiden aika on tullut? ”Itse asiassa kännykässä olevat henkilökohtaiset avustajat hoitavat jo droidin virkaa niin, että ihmisen näköistä fyysistä robottia ei enää tarvita. Ja robottiautomatiikka, R2D2 on monissa mekaanisissa toimissa aivan arkipäivää,” naurahtaa Klami.



Jitta ja Klami: Partially hidden Markov models for privacy-preserving modeling of indoor trajectories, Neurocomputing, 2017. Tutkimuksessa mallinnetaan paikkatietosensorien avulla ihmisten liikkumista julkisissa rakennuksissa (tässä tapauksessa suuri kauppa). Tavoitteena on ymmärtää miten ihmiset käyttävät tilaa ja ennustaa, mitä yksittäisen ihminen lähitulevaisuudessa mahdollisesti aikoo tehdä. Keskityimme tutkimuksessamme myös ihmisen yksilönsuojan säilyttämiseen, eli kehitimme sellaisia malleja, jotka voidaan oppia keräämättä tai paljastamatta kenenkään yksittäisen henkilön tarkkaa sijaintia rakennuksessa.

Katso aiheeseen liittyvä video: https://youtu.be/1JsHWgHPHzw

Teksti: Marja Nousiainen
Kuvat: Arto Klami ja Veikko Somerpuro    

Viimeksi muokattu 12.7.2017

Tietysti.fi on Suomen Akatemian sivusto, joka kertoo yleistajuisesti Akatemian rahoittamasta tutkimuksesta sekä tieteestä ja tutkimuksesta yleensä. Sivuille kootaan muun muassa tutkijahaastatteluita, tieteen yleisötapahtumia, tiedeuutisia ja tutkimuksesta kertovia taustajuttuja.

Seuraa meitä:

Ota yhteyttä

Suomen Akatemian viestintä
terhi.loukiainen@aka.fi

Lisätietoja Suomen Akatemiasta www.aka.fi