LLM2D

摘要

arXiv:2504.14625v3 宣告类型: replace-cross 摘要：大规模语言模型（LLMs）已变革了代码生成，但在硬件设计中的应用却导致门电路数量比人类设计多38%到1075%。我们介绍了一种名为CircuitMind的多智能体框架，通过三项关键创新实现了与人类竞争的效率：语法锁定（限制生成为基本逻辑门），检索增强生成（实现基于知识的设计），以及双重奖励优化（平衡正确性和效率）。为了评估我们的方法，我们引入了TC-Bench，这是首个利用TuringComplete生态系统集体智慧的门级基准测试——这是一个拥有数十万用户的竞争性电路设计平台。实验表明，CircuitMind使55.6%的模型实现能够达到或超过顶级人类专家的综合效率指标。更为令人惊讶的是，我们的框架将14B Phi-4模型提升至超越GPT-4o mini和Gemini 2.0 Flash，而无需特殊训练，其效率可与顶级人类专家的前25%相媲美。这些创新确立了硬件优化的新范式，即协同AI系统利用集体的人类智慧实现最优电路设计。我们的模型、数据和代码可在https://github.com/BUAA-CLab/CircuitMind获取。