דילוג לניווט ראשי דילוג לחיפוש דילוג לתוכן הראשי

HeGeL: A Novel Dataset for Geo-Location from Hebrew Text

  • Tzuf Paz-Argaman
  • , Tal Bauman
  • , Itai Mondshine
  • , Itzhak Omer
  • , Sagi Dalyot
  • , Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

The task of textual geolocation - retrieving the coordinates of a place based on a free-form language description - calls for not only grounding but also natural language understanding and geospatial reasoning. Even though there are quite a few datasets in English used for geolocation, they are currently based on open-source data (Wikipedia and Twitter), where the location of the described place is mostly implicit, such that the location retrieval resolution is limited. Furthermore, there are no datasets available for addressing the problem of textual geolocation in morphologically rich and resource-poor languages, such as Hebrew. In this paper, we present the Hebrew Geo-Location (HeGeL) corpus, designed to collect literal place descriptions and analyze lingual geospatial reasoning. We crowdsourced 5,649 literal Hebrew place descriptions of various place types in three cities in Israel. Qualitative and empirical analysis show that the data exhibits abundant use of geospatial reasoning and requires a novel environmental representation.

שפה מקוריתאנגלית
כותר פרסום המארחFindings of the Association for Computational Linguistics, ACL 2023
מוציא לאורAssociation for Computational Linguistics (ACL)
עמודים7311-7321
מספר עמודים11
מסת"ב (אלקטרוני)9781959429623
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 2023
פורסם באופן חיצוניכן
אירועFindings of the Association for Computational Linguistics, ACL 2023 - Toronto, קנדה
משך הזמן: 9 יולי 202314 יולי 2023

סדרות פרסומים

שםProceedings of the Annual Meeting of the Association for Computational Linguistics
ISSN (מודפס)0736-587X

כנס

כנסFindings of the Association for Computational Linguistics, ACL 2023
מדינה/אזורקנדה
עירToronto
תקופה9/07/2314/07/23

הערה ביבליוגרפית

Publisher Copyright:
© 2023 Association for Computational Linguistics.

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'HeGeL: A Novel Dataset for Geo-Location from Hebrew Text'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי