Diffusion maps for PLDA-based speaker verification

Oren Barkan, Hagai Aronowitz

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

During the last few years, i-vectors have become an important component in most state-of-the-art speaker recognition systems. Ivector extraction is based on an assumption that GMM supervectors reside on a low dimensional space, which is modeled using Factor Analysis. In this paper we replace the above assumption with an assumption that the GMM supervectors reside on a low dimensional manifold and propose to use Diffusion Maps to learn that manifold. The learnt manifold implies a mapping of spoken sessions into a modified i-vector space which we call d-vector space. D-vectors can further be processed using standard techniques such as LDA, WCCN, cosine distance scoring or Probabilistic Linear Discriminant Analysis (PLDA). We demonstrate the usefulness of our approach on the telephone core conditions of NIST 2010, and obtain significant error reduction.

שפה מקוריתאנגלית
כותר פרסום המארח2013 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013 - Proceedings
עמודים7639-7643
מספר עמודים5
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 18 אוק׳ 2013
פורסם באופן חיצוניכן
אירוע2013 38th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013 - Vancouver, BC, קנדה
משך הזמן: 26 מאי 201331 מאי 2013

סדרות פרסומים

שםICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
ISSN (מודפס)1520-6149

כנס

כנס2013 38th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013
מדינה/אזורקנדה
עירVancouver, BC
תקופה26/05/1331/05/13

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Diffusion maps for PLDA-based speaker verification'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי