LLM2D
LEMUR 神经网络数据集: Towards 平滑的自动化机器学习
LEMUR Neural Network Dataset: Towards Seamless AutoML
作者: Arash Torabi Goodarzi, Roman Kochnev, Waleed Khalid, Furui Qin, Tolgay Atinc Uzun, Yashkumar Sanjaybhai Dhameliya, Yash Kanubhai Kathiriya, Zofia Antonina Bentyn, Dmitry Ignatov, Radu Timofte
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2504.10552v1

摘要

arXiv:2504.10552v1 标签类型: cross 摘要:神经网络是人工智能的基础,推动了计算机视觉和自然语言处理的进步。高质量的数据集对于它们的发展至关重要,Growing Interest in 由神经网络本身组成的数据集也在增加,以支持基准测试、自动化机器学习(AutoML)和模型分析。我们介绍了LEMUR,一个开源的神经网络模型数据集,包含跨对象检测、图像分类、分割和自然语言处理等任务的多样化架构的井井有条的代码。LEMUR 主要旨在使大型语言模型(LLMs)的微调更容易进行AutoML任务,提供丰富的结构化模型表示和相关性能数据。利用 Python 和 PyTorch,LEMUR 使扩展到新数据集和模型变得无缝且保持一致性。它集成了一个由 Optuna 驱动的评估框架、超参数优化、统计分析和图形洞察。LEMUR 提供了一个扩展,使模型能够在边缘设备上高效运行,便于在资源受限的环境中部署。LEMUR 提供了模型评估、预处理和数据库管理的工具,支持研究人员和实践者开发、测试和分析神经网络。此外,它还提供了一个 API,可以通过一个请求提供神经网络模型及其完整性能统计的全面信息,可以在用代码生成大型语言模型的实验中使用。在论文被接受后,LEMUR 将作为 MIT 许可证下的开源项目发布。