OBAVIJEST O ODBRANI ZAVRŠNOG MAGISTARSKOG RADA – Adisa Aljukić, bachelor  inžinjer elektrotehnike

 UNIVERZITET U TUZLI
FAKULTET ELEKTROTEHNIKE
Franjevačka br.2
      Tuzla

 

O B J A V L J U J E

 

 Adisa Aljukić, bachelor  inžinjer elektrotehnike, javno će braniti  završni magistarski rad pod naslovom: „Identifikacija govornika u bučnim VoIP pozivima korištenjem LSTM dubokih neuronskih mreža“, dana 08.11.2024. godine u 14,00 sati  u Multimedijalnoj sali Univerziteta u Tuzli,  pred Komisijom u sastavu:

  1. Dr.sci.  Naser Prljača, redovni profesor-predsjednik
     Uža  naučna oblast  Automatika i robotika
    Fakultet elektrotehnike Univerziteta u Tuzli
  1. Dr.sci Lejla Banjanović-Mehmedović, vanredni profesor-mentor/član
    Uža  naučna oblast  Automatika i robotika
    Fakultet elektrotehnike Univerziteta u Tuzli
  1. Dr.sci.  Zenan Šehić, redovni profesor-član
     Uža  naučna oblast  Automatika i robotika
    Fakultet elektrotehnike Univerziteta u Tuzli

 

 Zamjenski član Komisije, dr.sci. Amila Dubravić, vanredni profesor, uža naučna oblast Automatika i robotika, Fakultet elektrotehnike Univerziteta u Tuzli.

Pristup javnosti je slobodan.

Završni Magistarski rad se može pogledati u Sekretarijatu fakulteta svakim radnim danom od 09,00 do 15,00 sati.

 

REZIME RADA

 

Potreba za sistemima za prepoznavanje govornika dolazi iz razvoja sistema za glasovnu komunikaciju. Kako se sve više ljudi oslanja na glasovnu komunikaciju u problematici digitalne transformacije, poslovne i personalne komunikacije, raste i potražnja za preciznom identifikacijom govornika u ne tako idealnim uslovima. U kontekstu VoIP poziva, buka se javlja zbog različitih realnih faktora kao što su loš signal, mrežni problemi te pozadinska buka. Svi navedeni faktori utiču na adekvatno prepoznavanje govornika tokom poziva što može dovesti do netačnih rezultata prilikom analize poziva.

Ovaj rad u svom teoretskom dijelu predstavlja nekoliko dosadašnjih istraživanja zajedno sa metodama vještačke inteligencije koje su korištene u prošlosti za prepoznavanje govornika. Prilikom razvoja modela korišten je pristup prenosa učenja sa nekim od najpoznatijih modela dubokog učenja za prepoznavanje govornika u audio zapisima kao što su x-vektor, SpeakerNet i DeepSpeaker.

Fokus istraživanja je stavljen na mogućnosti primjene LSTM dubokih neuronskih mreža u identifikaciji govornika u bučnim VoIP pozivima te je izvršena usporedba kreiranog LSTM modela sa state-of-art modelima u pogledu identifikacije govornika. Za treniranje i evaluaciju je korišten Python programski jezik te je prikazano da LSTM model kroz različite hibridne izvedbe, ima značajan potencijal u prepoznavanju govornika u bučnim VoIP okruženjima.