FI EN

Talprotes kan ge tillbaka förlorad röst

17.10.2012

Människor med skadade stämband kan snart få talproteser som de också kan uttrycka känslor med. Till exempel en liten flicka som förlorat rösten kan i framtiden få en röst som motsvarar hennes ålder. Hittills har barn ofta varit tvungna att använda talsyntetisatorer med en vuxen mans röst. Professor Samuli Siltanen har lett en undersökning som gör det möjligt att lösa problemet. Lösningen kommer att vara till stor hjälp för omkring 30 000 finländare. Siltanens projekt ingår i Finlands Akademis forskningsprogram Beräkningsvetenskaper (Lastu).

Ett centralt problem i analysen av talsignaler är att utifrån de digitalt inspelade vokala språkljuden dels urskilja stämbandsexcitationen, dels sluta sig till formen på ansatsröret, dvs. munnen och svalget. Det görs med s.k. invers filtrering som kräver specialiserad datorkalkylering. Med traditionell teknik ger invers filtrering goda resultat endast för låga mansröster. Kvinno- och barnröster är däremot svårare, eftersom röstens högre grundfrekvens ligger för nära ansatsrörets resonanser. Siltanens projekt har tagit fram en ny modell för inversionsberäkning som förbättrar den inversa filtreringen av den här typens röster.

Invers filtrering behövs förutom inom talsyntes också t.ex. i automatisk taligenkänning. I talsyntes förvandlar datorn en inmatad text till tal. Traditionellt har enskilda ord först bandats och sedan spelats upp efter varandra, men det tal som skapas med den metoden låter inte naturligt.

”En stor del av de språkljud som används i tal uppstår genom att luft strömmar mellan stämbanden och får dem att vibrera. Det ljud som då uppstår skulle låta som konstigt brummande, ifall vi kunde höra det. Men brummet från stämbanden nyanseras då det passerar genom ansatsröret och förvandlas till en igenkännbar vokal”, förklarar Siltanen.

Siltanen ger sång som ett exempel på denna tudelning i stämbandsexcitation resp. ansatsrör: ”Vi kan sjunga vokalen a i olika tonhöjder, varvid ansatsröret förblir oförändrat medan stämbandsexcitationens frekvens varierar. Men vi kan också sjunga olika vokaler i samma tonhöjd, och då är det ansatsrörets form som förändras medan excitationssignalen är konstant.”

Taligenkänning används t.ex. i mobiltelefoner och automatiska telefontjänster. En högklassig invers filtrering ger bättre resultat i bullrig omgivning.

Mer information:
professor Samuli Siltanen, institutionen för matematik och statistik vid Helsingfors universitet, tfn 09-191 51420 eller 040 594 3560, e-post samuli.siltanen@helsinki.fi

Finlands Akademi, kommunikationen
informatör Leena Vähäkylä
tfn 029 5335 139
fornamn.efternamn(at)aka.fi

  • FINLANDS AKADEMI
  • Hagnäskajen 6
  • PB 131
  • 00531 Helsingfors
Följ oss:
FacebookSlideshareTwitterYoutube
VÄXEL 0295 335 000
REGISTRATORS-
KONTOR
0295 335 049
FAX 0295 335 299
   
E-POST fornamn.efternamn@aka.fi
ÖPPETTIDER mån–fre 8.00–16.15
   
SÖK MEDARBETARE »
INTEGRITETSPOLICY »
KONTAKTINFORMATION & FAKTURERING »
FRÅGA OCH TYCK TILL »