The Hebrew Universal Dependency Treebank: Past, Present and Future

Shoval Sadde, Amit Seker, Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

The Hebrew treebank (HTB), consisting of 6221 morpho-syntactically annotated newspaper sentences, has been the only resource for training and validating statistical parsers and taggers for Hebrew, for almost two decades now. During these decades, the HTB has gone through a trajectory of automatic and semi-automatic conversions, until arriving at its UDv2 form. In this work we manually validate the UDv2 version of the HTB, and, according to our findings, we apply scheme changes that bring the UD HTB to the same theoretical grounds as the rest of UD. Our experimental parsing results with UDv2New confirm that improving the coherence and internal consistency of the UD HTB indeed leads to improved parsing performance. At the same time, our analysis demonstrates that there is more to be done at the point of intersection of UD with other linguistic processing layers, in particular, at the points where UD interfaces external morphological and lexical resources.

שפה מקוריתאנגלית
כותר פרסום המארחEMNLP 2018 - 2nd Workshop on Universal Dependencies, UDW 2018 - Proceedings of the Workshop
מוציא לאורAssociation for Computational Linguistics (ACL)
עמודים133-143
מספר עמודים11
מסת"ב (אלקטרוני)9781948087780
סטטוס פרסוםפורסם - 2018
אירוע2nd Workshop on Universal Dependencies, UDW 2018, held in conjunction with EMNLP 2018 - Brussels, בלגיה
משך הזמן: 1 נוב׳ 2018 → …

סדרות פרסומים

שםEMNLP 2018 - 2nd Workshop on Universal Dependencies, UDW 2018 - Proceedings of the Workshop

כנס

כנס2nd Workshop on Universal Dependencies, UDW 2018, held in conjunction with EMNLP 2018
מדינה/אזורבלגיה
עירBrussels
תקופה1/11/18 → …

הערה ביבליוגרפית

Publisher Copyright:
© 2018 Association for Computational Linguistics

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'The Hebrew Universal Dependency Treebank: Past, Present and Future'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי