تخطي إلى التنقل الرئيسي تخطي إلى البحث تخطي إلى المحتوى الرئيسي

Improving LLM Attributions with Randomized Path-Integration

  • Oren Barkan
  • , Yehonatan Elisha
  • , Yonatan Toib
  • , Jonathan Weill
  • , Noam Koenigstein

نتاج البحث: فصل من :كتاب / تقرير / مؤتمرمنشور من مؤتمرمراجعة النظراء

ملخص

We present Randomized Path-Integration (RPI)-a path-integration method for explaining language models via randomization of the integration path over the attention information in the model.RPI employs integration on internal attention scores and their gradients along a randomized path, which is dynamically established between a baseline representation and the attention scores of the model.The inherent randomness in the integration path originates from modeling the baseline representation as a randomly drawn tensor from a Gaussian diffusion process.As a consequence, RPI generates diverse baselines, yielding a set of candidate attribution maps.This set facilitates the selection of the most effective attribution map based on the specific metric at hand.We present an extensive evaluation, encompassing 11 explanation methods and 5 language models, including the Llama2 and Mistral models.Our results demonstrate that RPI outperforms latest state-of-the-art methods across 4 datasets and 5 evaluation metrics.Our code is available at: https://github.com/rpiconf/rpi.

اللغة الأصليةالإنجليزيّة
عنوان منشور المضيفEMNLP 2024 - 2024 Conference on Empirical Methods in Natural Language Processing, Findings of EMNLP 2024
المحررونYaser Al-Onaizan, Mohit Bansal, Yun-Nung Chen
ناشرAssociation for Computational Linguistics (ACL)
الصفحات9430-9446
عدد الصفحات17
رقم المعيار الدولي للكتب (الإلكتروني)9798891761681
المعرِّفات الرقمية للأشياء
حالة النشرنُشِر - 2024
الحدث2024 Findings of the Association for Computational Linguistics, EMNLP 2024 - Hybrid, Miami, الولايات المتّحدة
المدة: ١٢ نوفمبر ٢٠٢٤١٦ نوفمبر ٢٠٢٤

سلسلة المنشورات

الاسمEMNLP 2024 - 2024 Conference on Empirical Methods in Natural Language Processing, Findings of EMNLP 2024

!!Conference

!!Conference2024 Findings of the Association for Computational Linguistics, EMNLP 2024
الدولة/الإقليمالولايات المتّحدة
المدينةHybrid, Miami
المدة١٢/١١/٢٤١٦/١١/٢٤

ملاحظة ببليوغرافية

Publisher Copyright:
© 2024 Association for Computational Linguistics.

بصمة

أدرس بدقة موضوعات البحث “Improving LLM Attributions with Randomized Path-Integration'. فهما يشكلان معًا بصمة فريدة.

قم بذكر هذا