Akatemiatutkija Ville Pulkki kehittänyt
yleiseksi ääniformaatiksi sopivaa tekniikkaa
Akatemiatutkija Ville Pulkki on tutkimusryhmänsä kanssa kehittänyt yleiseksi ääniformaatiksi soveltuvaa tekniikkaa. Se voi mullistaa koko ääniteteollisuuden, koska tallennetta voitaisiin kuunnella millä tahansa kaiutinasettelulla tai kuulokkeilla ja aina parhaalla mahdollisella laadulla. Kotistereot voitaisiin tehdä sellaisiksi, että kaiuttimet voisi asetella sinne mihin ne sopivat, ja niiden määrää voisi muutella. Stereot mittaisivat kaukosäätimen avulla, missä kaiuttimet ovat, ja säätäisivät itsensä niin, että optimaalinen laatu saataisiin aikaan. Tätä kutsutaan yleiseksi ääniformaatiksi.
Teknillisen korkeakoulun (TKK) Signaalikäsittelyn ja Akustiikan laitoksella on tutkittu tilaäänen havaitsemista ja teknologiaa. Pulkin ryhmän kehittämää menetelmää voi soveltaa sekä telekonferensseissa että yleisissä ääniformaateissa. Se perustuu ihmisen tilakuulomekanismien heikkouksien tuntemiseen sekä äänikentän suunta-analyysiin. Ääni jaetaan taajuuskaistoihin. Jokaisella kaistalla analysoidaan, mistä suunnasta ääni saapuu, ja saapuuko se yhdestä vai monesta suunnasta. Tämä tieto koodataan lähetettävän äänen mukaan metadataksi. Äänen toistossa ääni viedään kaiuttimiin metadatassa olevan tiedon mukaan, jolloin kuuntelija havaitsee äänilähteet oikeissa suunnissa, ja äänityshuoneen kaiunta toistuu myös oikealla tavalla. Menetelmälle on annettu nimi Directional Audio Coding (DirAC).
TKK on myynyt DirACia suojaavat patentit Saksan suurimmalle tutkimuslaitokselle Fraunhofer Gesellschaftille (FhG) kaupassa, joka on TKK:n suurimpia. TKK jatkaa FhG:n kanssa DirACin kehittämistä.
Hyvä sovellus telekonferensseihin
DirAC soveltuu hyvin telekonferenssisovelluksiin. Paikasta A paikkaan B tarvitsee lähettää vain yksi kanava ääntä, sekä suuntametadataa hyvin kapealla kaistalla. Äänittämistä varten tarvitaan vähintään stereomikrofoni, ja kuuntelussa voi käyttää kuulokkeita tai mitä tahansa
määrää kaiuttimia. Menetelmä on joustava: paikassa A ei tarvitse tietää, minkälainen kuuntelujärjestelmä paikassa B on. Lähetettävä metadata on riippumaton vastaanottajan kuuntelujärjestelmästä.
DirAC on myös hyvä lähtökohta yleiseksi ääniformaatiksi. Äänitteille tallennettaisiin 1-3 kanavaa ääntä, sekä metadata. Tämän sovelluksen tutkimus on vielä kesken: tarvitaan lisää perustutkimusta, jotta ymmärretään, miten päästään parhaaseen mahdolliseen laatuun mielivaltaisissa kuunteluolosuhteissa.
Tilaääni tutkii tilan vaikutusta ääneen
Tilaääni on Pulkin tieteenala. Se tutkii tilan vaikutusta ääneen yleensä havaitsijan kannalta. Se tutkii esimerkiksi sitä, millä mekanismeilla ihminen pystyy havaitsemaan äänilähteiden suunnat ja etäisyydet sekä huoneen koon. Tilaäänen teknologiat taas ovat keinoja, joissa ääntä toistetaan siten, että sen havaitut tilaominaisuudet pyritään joko säilyttämään tai muuttamaan. Esimerkiksi elokuvien 5.1-surround-kuuntelussa kuvassa näkyvät tai kuvan ulkopuolella olevat äänilähteet voidaan tuottaa haluttuihin suuntiin.
Tilaäänen alueella on kehitteillä tekniikoita, jotka saattavat yleistyä tulevaisuudessa. Yksi tekniikka liittyy telekonferensseihin kuten kuvapuheluihin tai virtuaalitapaamisiin. Nykyisissä järjestelmissä ääni välitetään yhtenä kanavana, ja se toistetaan pääsääntöisesti yhdellä kaiuttimella. Jos kaksi muutaman henkilön ryhmää keskustelee keskenään tällaisella yhteydellä, on vaikeaa seurata keskustelua, koska kuuntelija ei voi päätellä puhujaa havaitsemansa äänen suunnan avulla. Usean mikrofonin ja kaiuttimen tekniikoita on ehdotettu, ja osin käytössäkin. Näissä tekniikoissa on se ongelma, että mikrofonien ominaisuuksien vuoksi suuntaa ei välttämättä havaita oikein ja siirrettävien kanavien määrä kasvaa. Siksi Pulkin kehittämä tekniikka on tarpeen.
Lisätietoja antaa akatemiatutkija, dosentti Ville Pulkki, Teknillisen korkeakoulun Signaalinkäsittelyn ja akustiikan laitos, p. (09) 451 2498, sp. ville.pulkki(at)tkk.fi.
Suomen Akatemian viestintä
tiedottaja Leena Vähäkylä
p. (09) 7748 8327
leena.vahakyla(at)aka.fi