Learning to Explain: A Model-Agnostic Framework for Explaining Black Box Models

Oren Barkan, Yuval Asher, Amit Eshel, Yehonatan Elisha, Noam Koenigstein

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

We present Learning to Explain (LTX), a model-agnostic framework designed for providing post-hoc explanations for vision models. The LTX framework introduces an 'explainer' model that generates explanation maps, highlighting the crucial regions that justify the predictions made by the model being explained. To train the explainer, we employ a two-stage process consisting of initial pretraining followed by per-instance finetuning. During both stages of training, we utilize a unique configuration where we compare the explained model's prediction for a masked input with its original prediction for the unmasked input. This approach enables the use of a novel counterfactual objective, which aims to anticipate the model's output using masked versions of the input image. Importantly, the LTX framework is not restricted to a specific model architecture and can provide explanations for both Transformer-based and convolutional models. Through our evaluations, we demonstrate that LTX significantly outperforms the current state-of-the-art in explainability across various metrics. Our code is available at: https://github.comLTX-CodeLTX

שפה מקוריתאנגלית
כותר פרסום המארחProceedings - 23rd IEEE International Conference on Data Mining, ICDM 2023
עורכיםGuihai Chen, Latifur Khan, Xiaofeng Gao, Meikang Qiu, Witold Pedrycz, Xindong Wu
מוציא לאורInstitute of Electrical and Electronics Engineers Inc.
עמודים944-949
מספר עמודים6
מסת"ב (אלקטרוני)9798350307887
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 2023
פורסם באופן חיצוניכן
אירוע23rd IEEE International Conference on Data Mining, ICDM 2023 - Shanghai, סין
משך הזמן: 1 דצמ׳ 20234 דצמ׳ 2023

סדרות פרסומים

שםProceedings - IEEE International Conference on Data Mining, ICDM
ISSN (מודפס)1550-4786

כנס

כנס23rd IEEE International Conference on Data Mining, ICDM 2023
מדינה/אזורסין
עירShanghai
תקופה1/12/234/12/23

הערה ביבליוגרפית

Publisher Copyright:
© 2023 IEEE.

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Learning to Explain: A Model-Agnostic Framework for Explaining Black Box Models'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי