LLM2D
Nd-BiMamba2:一种用于多维数据处理的统一双向架构
Nd-BiMamba2: A Unified Bidirectional Architecture for Multi-Dimensional Data Processing
作者: Hao Liu
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15380v1

摘要

深度学习模型通常需要专门设计的架构来处理不同维度的数 据,例如一维时间序列、二维图像和三维体数据。现有的双向模型主要关注序列数据,难以有效扩展到更高维度。为了解决这个问题,我们提出了一种新颖的多维双向神经网络架构,名为 Nd-BiMamba2,它可以高效地处理一维、二维和三维数据。Nd-BiMamba2 基于 Mamba2 模块,并引入了创新的双向处理机制和自适应填充策略,以在保持计算效率的同时捕获多维数据中的双向信息。与需要为不同维度数据设计特定架构的现有方法不同,Nd-BiMamba2 采用具有模块化设计的统一架构,简化了开发和维护成本。为了验证 Nd-BiMamba2 的可移植性和灵活性,我们成功地将其导出到 ONNX 和 TorchScript,并在不同的硬件平台(例如 CPU、GPU 和移动设备)上进行了测试。实验结果表明,Nd-BiMamba2 在多个平台上运行效率很高,证明了其在实际应用中的潜力。代码已开源:https://github.com/Human9000/nd-Mamba2-torch