Data-driven broad-coverage grammars for opinionated natural language generation (ONLG)

Tomer Cagan, Stefan L. Frank, Reut Tsarfaty

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

Opinionated natural language generation (ONLG) is a new, challenging, NLG task in which we aim to automatically generate human-like, subjective, responses to opinionated articles online. We present a data-driven architecture for ONLG that generates subjective responses triggered by users' agendas, based on automatically acquired wide-coverage generative grammars. We compare three types of grammatical representations that we design for ONLG. The grammars interleave different layers of linguistic information, and are induced from a new, enriched dataset we developed. Our evaluation shows that generation with Relational-Realizational (Tsarfaty and Sima'an, 2008) inspired grammar gets better language model scores than lexicalized grammars à la Collins (2003), and that the latter gets better human-evaluation scores. We also show that conditioning the generation on topic models makes generated responses more relevant to the document content.

שפה מקוריתאנגלית
כותר פרסום המארחACL 2017 - 55th Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference (Long Papers)
מוציא לאורAssociation for Computational Linguistics (ACL)
עמודים1331-1341
מספר עמודים11
מסת"ב (אלקטרוני)9781945626753
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 2017
אירוע55th Annual Meeting of the Association for Computational Linguistics, ACL 2017 - Vancouver, קנדה
משך הזמן: 30 יולי 20174 אוג׳ 2017

סדרות פרסומים

שםACL 2017 - 55th Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference (Long Papers)
כרך1

כנס

כנס55th Annual Meeting of the Association for Computational Linguistics, ACL 2017
מדינה/אזורקנדה
עירVancouver
תקופה30/07/174/08/17

הערה ביבליוגרפית

Publisher Copyright:
© 2017 Association for Computational Linguistics.

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Data-driven broad-coverage grammars for opinionated natural language generation (ONLG)'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי