Väitös puhe- ja kieliteknologian alalta, Heikki Kallasjoki

2016-04-15 12:00:56 2016-04-15 16:00:17 Europe/Helsinki Väitös puhe- ja kieliteknologian alalta, Heikki Kallasjoki Väitöksen nimi on Piirteiden korjaus ja epävarmuuden arviointi melua ja kohinaa sisältävän puheen tunnistuksessa. http://old.spa.aalto.fi/fi/midcom-permalink-1e5e46cde1efa2ae46c11e5899127f3cbde53c353c3 Otakaari 5A, 02150, Espoo

Väitöksen nimi on Piirteiden korjaus ja epävarmuuden arviointi melua ja kohinaa sisältävän puheen tunnistuksessa.

15.04.2016 / 12:00 - 16:00
Sali S1, Otakaari 5A, 02150, Espoo, FI

Vaikka puheentunnistusjärjestelmillä on jo monia käytännön sovelluksia, ovat ne edelleen huomattavasti ihmistä heikompia sietämään ympäristöstä aiheutuvia häiriöitä. Mobiililaitteiden yleistymisen vuoksi puheentunnistusta käytetään kuitenkin mitä erilaisemmissa meluisissa tilanteissa, kuten ulkona liikenteessä tai keskellä puheensorinaa. Olohuoneisiin suunnitelluissa viihdelaitteissa taas ongelmia aiheuttaa kaukana puhujasta oleva mikrofoni, jonka nauhoittamassa äänessä on mukana runsaasti kaikua.

Tässä väitöskirjassa tutkitaan menetelmiä, joilla nauhoitettua puhesignaalia voidaan muokata siten, että melu ja kaiku vaikuttavat siihen vähemmän. Matalalla tasolla ongelmaa lähestytään tutkimalla luotettavampia tapoja signaalin spektrin arvioimiseksi. Puheen ja melun erottamiseen toisistaan sovelletaan ns. puuttuvaan dataan ja epänegatiiviseen matriisihajotelmaan perustuvia menetelmiä sekä näiden yhdistelmää. Kaiusta aiheutuvien häiriöiden käsittelemiseksi esitetään matriisihajotelmaan pohjautuvan menetelmän laajennus, jossa kaiun vaikutus mallinnetaan osana matriisihajotelmaa.

Puhesignaalin suoranaisen korjauksen lisäksi väitöskirjassa kehitetään tapoja arvioida tuloksena saadun signaalin luotettavuutta. Siten pystytään tuottamaan arvio siitä, mitkä aika- ja taajuusalueet todennäköisesti sisältävät häiriöitä, ja mitkä puolestaan eivät. Tätä arviota voidaan hyödyntää puheentunnistuksessa antamalla tunnistimen kiinnittää enemmän huomiota luotettavimpiin alueisiin, ja jättämään todennäköisesti melun pilaamat osat signaalista huomioimatta.

Vastaväittäjänä toimii professori Dorothea Kolossa, Ruhr-Universität Bochum, Saksa

Valvojana on professori Mikko Kurimo, Aalto-yliopiston sähkötekniikan korkeakoulu, Signaalinkäsittelyn ja akustiikan laitos

Väitöskirjan verkko-osoite

Väittelijän yhteystiedot:
Heikki Kallasjoki
heikki.kallasjoki@iki.fi