摘要
arXiv:2504.14625v3 宣告类型: replace-cross
摘要:大规模语言模型(LLMs)已变革了代码生成,但在硬件设计中的应用却导致门电路数量比人类设计多38%到1075%。我们介绍了一种名为CircuitMind的多智能体框架,通过三项关键创新实现了与人类竞争的效率:语法锁定(限制生成为基本逻辑门),检索增强生成(实现基于知识的设计),以及双重奖励优化(平衡正确性和效率)。为了评估我们的方法,我们引入了TC-Bench,这是首个利用TuringComplete生态系统集体智慧的门级基准测试——这是一个拥有数十万用户的竞争性电路设计平台。实验表明,CircuitMind使55.6%的模型实现能够达到或超过顶级人类专家的综合效率指标。更为令人惊讶的是,我们的框架将14B Phi-4模型提升至超越GPT-4o mini和Gemini 2.0 Flash,而无需特殊训练,其效率可与顶级人类专家的前25%相媲美。这些创新确立了硬件优化的新范式,即协同AI系统利用集体的人类智慧实现最优电路设计。我们的模型、数据和代码可在https://github.com/BUAA-CLab/CircuitMind获取。