A single generative model for joint morphological segmentation and syntactic parsing

Yoav Goldberg, Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

Morphological processes in Semitic languages deliver space-delimited words which introduce multiple, distinct, syntactic units into the structure of the input sentence. These words are in turn highly ambiguous, breaking the assumption underlying most parsers that the yield of a tree for a given sentence is known in advance. Here we propose a single joint model for performing both morphological segmentation and syntactic disambiguation which bypasses the associated circularity. Using a treebank grammar, a data-driven lexicon, and a linguistically motivated unknown-tokens handling technique our model outperforms previous pipelined, integrated or factorized systems for Hebrew morphological and syntactic processing, yielding an error reduction of 12% over the best published results so far.

שפה מקוריתאנגלית
כותר פרסום המארחACL-08
כותר משנה של פרסום המארחHLT - 46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, Proceedings of the Conference
עמודים371-379
מספר עמודים9
סטטוס פרסוםפורסם - 2008
פורסם באופן חיצוניכן
אירוע46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, ACL-08: HLT - Columbus, OH, ארצות הברית
משך הזמן: 15 יוני 200820 יוני 2008

סדרות פרסומים

שםACL-08: HLT - 46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, Proceedings of the Conference

כנס

כנס46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, ACL-08: HLT
מדינה/אזורארצות הברית
עירColumbus, OH
תקופה15/06/0820/06/08

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'A single generative model for joint morphological segmentation and syntactic parsing'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי