LLM2D
OmniNova:一种通用的多模态代理框架
OmniNova:A General Multimodal Agent Framework
作者: Pengfei Du
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2503.20028v1

摘要

arXiv:2503.20028v1 类型:新发布 摘要:将大型语言模型(LLMs)与专门工具集成为智能自动化系统提供了新的机会。然而,由于协调困难、资源利用效率低下和信息流不一致的问题,将多个LLM驱动的代理用于解决复杂任务仍然具有挑战性。我们提出了OmniNova,这是一种将语言模型与搜索引擎、爬虫和代码执行能力等专门工具相结合的模块化多代理自动化框架。OmniNova 引入了三个关键创新点:(1) 一种分层多代理架构,包括协调器、规划员、监督员和专门代理;(2) 一种动态任务路由机制,基于任务复杂度优化代理部署;以及 (3) 一种多层次的语言模型集成系统,将适当的模型分配到不同的认知需求。在涉及研究、数据分析和网络交互领域的50个复杂任务的评估中,OmniNova 的任务完成率(87% vs. 基线62%)和效率(减少41%的 token 使用量)均优于现有框架,并且结果质量(人类评估得分为4.2/5 vs. 基线3.1/5)更高。我们不仅提供了一种多代理系统的理论框架,还提供了一个开源实现,该实现推动了基于LLM的自动化系统的发展。