דילוג לניווט ראשי דילוג לחיפוש דילוג לתוכן הראשי

Minimal Supervision for Morphological Inflection

  • Omer Goldman
  • , Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

Neural models for the various flavours of morphological reinflection tasks have proven to be extremely accurate given ample labeled data, yet labeled data may be slow and costly to obtain. In this work we aim to overcome this annotation bottleneck by bootstrapping labeled data from a seed as small as five labeled inflection tables, accompanied by a large bulk of unlabeled text. Our bootstrapping method exploits the orthographic and semantic regularities in morphological systems in a two-phased setup, where word tagging based on analogies is followed by word pairing based on distances. Our experiments with the Paradigm Cell Filling Problem over eight typologically different languages show that in languages with relatively simple morphology, orthographic regularities on their own allow inflection models to achieve respectable accuracy. Combined orthographic and semantic regularities alleviate difficulties with particularly complex morpho-phonological systems. We further show that our bootstrapping methods substantially outperform hallucination-based methods commonly used for overcoming the annotation bottleneck in morphological reinflection tasks.

שפה מקוריתאנגלית
כותר פרסום המארחEMNLP 2021 - 2021 Conference on Empirical Methods in Natural Language Processing, Proceedings
מוציא לאורAssociation for Computational Linguistics (ACL)
עמודים2078-2088
מספר עמודים11
מסת"ב (אלקטרוני)9781955917094
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 2021
פורסם באופן חיצוניכן
אירוע2021 Conference on Empirical Methods in Natural Language Processing, EMNLP 2021 - Hybrid, Punta Cana, !!Dominican Republic
משך הזמן: 7 נוב׳ 202111 נוב׳ 2021

סדרות פרסומים

שםEMNLP 2021 - 2021 Conference on Empirical Methods in Natural Language Processing, Proceedings

כנס

כנס2021 Conference on Empirical Methods in Natural Language Processing, EMNLP 2021
מדינה/אזור!!Dominican Republic
עירHybrid, Punta Cana
תקופה7/11/2111/11/21

הערה ביבליוגרפית

Publisher Copyright:
© 2021 Association for Computational Linguistics

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Minimal Supervision for Morphological Inflection'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי