Bioinformaatikko pyrkii ennustamaan sairastumisesi kymmeniä vuosia etukäteen
Suomen Akatemian tutkijatohtori Pashupati Mishra Tampereen yliopistosta on jo kahdeksan vuoden ajan keskittynyt tutkimaan sydän- ja verisuonitautien ennustamista. ”Haluaisin kehittää koneoppimismenetelmiä, joilla voidaan tunnistaa sydän- ja verisuonitautien biomarkkereita.”
Tavoitteena on löytää näitä sydän- ja verisuonitautien ennusmerkkejä jopa vuosikymmeniä ennen tautien puhkeamista. Tietojen avulla tautien puhkeamista voitaisiin ehkäistä etukäteen.
Nykyään sydän- ja verisuonitautien todennäköisyyttä ennustetaan yksinkertaisten riskitekijöiden avulla. Näitä ovat esimerkiksi kohonnut verenpaine, korkea kolesteroli, diabetes, tupakointi, vähäinen liikunta ja suvun sairauksina ilmenneet perintötekijät.
”On kuitenkin ihmisiä, joiden kolesterolipitoisuus on ihanteellinen, mutta jotka silti sitten yhtäkkiä saavat sydänkohtauksen. Siksi kehitämme tarkempia tapoja ennustaa myöhempää sairastumista”, Mishra sanoo.
Tutkijatohtori Pashupati Mishra etsii sairauksia ennustavia geenejä ja muita biomarkkereita käsittelemällä suuria tietomääriä bioinformaatikkona.
Tutkijat käyvät läpi valtavaa määrää tietoa ihmisestä
Ihmisestä voidaan nykyään saada selville valtava määrä tietoa. Nykyisten genomitekniikoiden avulla voidaan tutkia yhtäaikaisesti tuhansia geeniä, kun geenitutkimuksen alussa tutkijat pystyivät tutkimaan vain yksittäisiä geenejä silloin käytettävissä olevin menetelmin. Tämän lisäksi ihmisestä voidaan nyt tutkia satoja molekyylisiä lipidejä eli ketjumaisia rasva-aineita massaspektrometrillä. Ihmisessä elää myös valtava määrä mikrobeita, joilla on merkitystä terveydelle, ja nämä mikrobit voidaan selvittää.
”Yritän löytää näitä kaikkia tutkimalla esimerkiksi bakteereja tai lipidejä tai geenejä, jotka liittyvät sydän- ja verisuonitauteihin. Ja kun saan selville nämä biomarkkerit, yritän kehittää tavan ennustaa niistä tulevia sydän- ja verisuonitauteja.”
Ennustaminen tapahtuu laskemalla sairastumisen todennäköisyyksiä näiden biomarkkereiden esiintymisestä.
”Hyödynnän tietotekniikkaa, tietojenkäsittelytieteitä, tilastollisia menetelmiä ja matemaattista mallintamista biologian ymmärtämiseksi”, Mishra selventää.
Kuvateksti: Tutkijatohtori Pashupati Mishra etsii sairauksia ennustavia geenejä ja muita biomarkkereita käsittelemällä suuria tietomääriä bioinformaatikkona.
Tarvitaan koneoppimista ja supertietokone
Mishra hyödyntää koneoppimista. Siinä tietokoneohjelma laitetaan oppimaan datasta esimerkiksi erilaisia riippuvuussuhteita ilman tarkkoja etukäteisohjeita. Koneoppimista käytetään nykyään jo paljon esimerkiksi puheen muuttamiseksi automaattisesti tekstiksi, henkilöiden tunnistamiseksi kuvista tai vaikkapa petosten tunnistamiseksi luottokortilla maksettaessa.
Valtavien tietomassojen käsittelemiseksi Mishra käyttää työssään suomalaisia CSC:n eli Tieteen tietotekniikan keskuksen supertietokoneita. Niiden tehot kasvavat nopeasti.
Suomen seuraavaa kansallista supertietokonetta Roihua rakennetaan parhaillaan Kajaaniin. Kun se valmistuu vuoden 2025 aikana, Roihu kolminkertaistaa Suomen nykyisten kansallisten supertietokoneiden laskentaresurssit. Roihussa on laskentatehoa 49 petaflopsia, eli se pystyy laskemaan 49 tuhatta biljoonaa laskutoimitusta sekunnissa.
Sitten kun parhaiten sairastumista ennustavat geenit, rasva-ainemolekyylit tai mikrobit on saatu selville eli tiedetään, mitä tietoja ihmisistä pitää selvittää, yksittäiset ihmiset saadaan tutkittua nopeasti.
”Riittää, että tutkittava ihminen antaa verinäytteen ja kaikki tarvittavat tiedot löydetään tästä muutamalla sadalla eurolla.”
Supertietokone Puhti, X400, Atos. Kuva: CSC.
Tutkijoilla poikkeuksellinen tietokanta ihmisistä
Sairastumista ennustavien tekijöiden selvittämiseksi on supertietokoneiden päästävä etsimään ennustavia tekijöitä suuren ihmisjoukon tiedoista. Mishra saa nämä nuorten suomalaisten sydän- ja verisuonitautiriskitutkimuksesta (Cardiovascular Risk in Young Finns Study, YFS). Tutkimus perustuu 3596 miehen ja naisen ryhmään. Kun ryhmä luotiin vuonna 1980, he olivat kaikki alaikäisiä. Ryhmän jäseniä on seurattu nyt jo yli 40 vuoden ajan, ja rekisteriin on kerätty myös tiedot heidän lapsistaan ja vanhemmistaan.
Päätavoitteena vuonna 1980 oli perustaa monipolvinen väestötietokanta, näytteiden biopankki ja yhteydet kansallisiin terveysrekistereihin, jotka tarjoaisivat ainutlaatuisia mahdollisuuksia ominaisuuksien perinnöllisen siirtymisen sekä elämänkulkuun vaikuttavien tekijöiden tutkimiseen.
”Tiedämme heidän elämäntapansa, ympäristötekijöitä, ruokavalion ja muita tietoja. Voimme nähdä, mitä tapahtui heidän lapsuudessaan ja mitä heidän terveydelleen tapahtuu tällä hetkellä. Tämä on maailmanlaajuisesti poikkeuksellinen mahdollisuus”, Mishra kertoo.
Mishra myös kertoo innostuneesti siitä, miten tietojen käsittely mahdollistaa eri tautien yhteyksien tunnistamisen. Moni sydän- ja verisuonitauteihin sairastuvista kuolee johonkin muuhun tautiin. Kun koneoppiminen tunnistaa yhteydet, voidaan yhden taudin hoidolla estää myös toisen taudin kehittymistä ja hoitaa vaikkapa yhdellä lääkkeellä kahta eri tautia.
Ilmainen laadukas opetus toi Mishran Suomeen
Suomen Akatemia tukee Mishran tutkimusryhmän työtä. Hän on viimeisiä tutkijatohtorin rahoituksella työskenteleviä. Tällä hetkellä Mishra julkaisee tutkimustuloksiaan kansainvälisesti arvostetuissa lääketieteellisissä julkaisuissa ja tekee paljon kansainvälistä tutkimusyhteistyötä alansa tutkijoiden kanssa.
Suomessa Mishra on asunut 16 vuotta, ja hänen Suomessa syntynyt tyttärensä puhuu sujuvaa suomea. Suomi ei kuitenkaan ollut Mishran alkuperäisessä suunnitelmassa maa, johon asettua. Hän on nepalilainen, joka suoritti ensin kandidaatin opintonsa Intiassa. Tavoitteena oli päästä tekemään maisterinopintoja Yhdysvalloissa, mutta lopulta hän löysikin itsensä bioinformatiikan maisterinohjelmasta Turun yliopistosta, koska täällä opiskeleminen oli mahdollista taloudellisista rajoituksista huolimatta.
”On aika uskomatonta, että Suomessa voi opiskella ilmaiseksi ja saada niin laadukkaan koulutuksen.”
Teksti: Visa Noronen
Kuva: Tampereen yliopisto