UNIVERZITET U TUZLI
FAKULTET ELEKTROTEHNIKE
Franjevačka br.2
Tuzla
O B J A V L J U J E
Adisa Aljukić, bachelor inžinjer elektrotehnike, javno će braniti završni magistarski rad pod naslovom: „Identifikacija govornika u bučnim VoIP pozivima korištenjem LSTM dubokih neuronskih mreža“, dana 08.11.2024. godine u 14,00 sati u Multimedijalnoj sali Univerziteta u Tuzli, pred Komisijom u sastavu:
- Dr.sci. Naser Prljača, redovni profesor-predsjednik
Uža naučna oblast Automatika i robotika
Fakultet elektrotehnike Univerziteta u Tuzli
- Dr.sci Lejla Banjanović-Mehmedović, vanredni profesor-mentor/član
Uža naučna oblast Automatika i robotika
Fakultet elektrotehnike Univerziteta u Tuzli
- Dr.sci. Zenan Šehić, redovni profesor-član
Uža naučna oblast Automatika i robotika
Fakultet elektrotehnike Univerziteta u Tuzli
Zamjenski član Komisije, dr.sci. Amila Dubravić, vanredni profesor, uža naučna oblast Automatika i robotika, Fakultet elektrotehnike Univerziteta u Tuzli.
Pristup javnosti je slobodan.
Završni Magistarski rad se može pogledati u Sekretarijatu fakulteta svakim radnim danom od 09,00 do 15,00 sati.
REZIME RADA
Potreba za sistemima za prepoznavanje govornika dolazi iz razvoja sistema za glasovnu komunikaciju. Kako se sve više ljudi oslanja na glasovnu komunikaciju u problematici digitalne transformacije, poslovne i personalne komunikacije, raste i potražnja za preciznom identifikacijom govornika u ne tako idealnim uslovima. U kontekstu VoIP poziva, buka se javlja zbog različitih realnih faktora kao što su loš signal, mrežni problemi te pozadinska buka. Svi navedeni faktori utiču na adekvatno prepoznavanje govornika tokom poziva što može dovesti do netačnih rezultata prilikom analize poziva.
Ovaj rad u svom teoretskom dijelu predstavlja nekoliko dosadašnjih istraživanja zajedno sa metodama vještačke inteligencije koje su korištene u prošlosti za prepoznavanje govornika. Prilikom razvoja modela korišten je pristup prenosa učenja sa nekim od najpoznatijih modela dubokog učenja za prepoznavanje govornika u audio zapisima kao što su x-vektor, SpeakerNet i DeepSpeaker.
Fokus istraživanja je stavljen na mogućnosti primjene LSTM dubokih neuronskih mreža u identifikaciji govornika u bučnim VoIP pozivima te je izvršena usporedba kreiranog LSTM modela sa state-of-art modelima u pogledu identifikacije govornika. Za treniranje i evaluaciju je korišten Python programski jezik te je prikazano da LSTM model kroz različite hibridne izvedbe, ima značajan potencijal u prepoznavanju govornika u bučnim VoIP okruženjima.