תקציר
The Memory Allocation problem for neural networks can be represented as a two-dimensional optimization problem. The neural network is allocated into limited memory space while allocating as much data as possible into the low latency memory. Our solution is based on a generalization of graph coloring, edge-to-node transformation and considers the order in which the graph nodes are colored. We observed improvement of more than 40% in SRAM memory bandwidth in various neural networks.
שפה מקורית | אנגלית |
---|---|
כותר פרסום המארח | ICDCN 2022 - Proceedings of the 2022 International Conference on Distributed Computing and Networking |
מוציא לאור | Association for Computing Machinery |
עמודים | 232-233 |
מספר עמודים | 2 |
מסת"ב (אלקטרוני) | 9781450395601 |
מזהי עצם דיגיטלי (DOIs) | |
סטטוס פרסום | פורסם - 4 ינו׳ 2022 |
אירוע | 23rd International Conference on Distributed Computing and Networking, ICDCN 2022 - Virtual, Online, הודו משך הזמן: 4 ינו׳ 2022 → 7 ינו׳ 2022 |
סדרות פרסומים
שם | ACM International Conference Proceeding Series |
---|
כנס
כנס | 23rd International Conference on Distributed Computing and Networking, ICDCN 2022 |
---|---|
מדינה/אזור | הודו |
עיר | Virtual, Online |
תקופה | 4/01/22 → 7/01/22 |
הערה ביבליוגרפית
Publisher Copyright:© 2022 Owner/Author.