Universal Morpho-syntactic Parsing and the Contribution of Lexica: Analyzing the OnLP lab submission to the conll 2018 shared task

Amit Seker, Amir More, Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

We present the contribution of the ONLP lab at the Open University of Israel to the CONLL 2018 UD SHARED TASK on MULTILINGUAL PARSING FROM RAW TEXT TO UNIVERSAL DEPENDENCIES. Our contribution is based on a transition-based parser called yap: yet another parser which includes a standalone morphological model, a standalone dependency model, and a joint morphosyntactic model. In the task we used yap's standalone dependency parser to parse input morphologically disambiguated by UDPipe, and obtained the official score of 58.35 LAS. In a follow up investigation we use yap to show how the incorporation of morphological and lexical resources may improve the performance of end-to-end raw-to-dependencies parsing in the case of a morphologically-rich and low-resource language, Modern Hebrew. Our results on Hebrew underscore the importance of CoNLL-UL, a UD-compatible standard for accessing external lexical resources, for enhancing end-to-end UD parsing, in particular for morphologically rich and low-resource languages. We thus encourage the community to create, convert, or make available more such lexica.

שפה מקוריתאנגלית
כותר פרסום המארחCoNLL 2018 - SIGNLL Conference on Computational Natural Language Learning, Proceedings of the CoNLL 2018 Shared Task
כותר משנה של פרסום המארחMultilingual Parsing from Raw Text to Universal Dependencies
מוציא לאורAssociation for Computational Linguistics (ACL)
עמודים208-215
מספר עמודים8
מסת"ב (אלקטרוני)9781948087827
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 2018
אירוע2018 SIGNLL Conference on Computational Natural Language Learning, CoNLL Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, CoNLL 2018 - Brussels, בלגיה
משך הזמן: 31 אוק׳ 20181 נוב׳ 2018

סדרות פרסומים

שםCoNLL 2018 - SIGNLL Conference on Computational Natural Language Learning, Proceedings of the CoNLL 2018 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies

כנס

כנס2018 SIGNLL Conference on Computational Natural Language Learning, CoNLL Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, CoNLL 2018
מדינה/אזורבלגיה
עירBrussels
תקופה31/10/181/11/18

הערה ביבליוגרפית

Publisher Copyright:
© 2018 Association for Computational Linguistics

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Universal Morpho-syntactic Parsing and the Contribution of Lexica: Analyzing the OnLP lab submission to the conll 2018 shared task'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי