摘要
arXiv:2504.08645v1 交叉类型:cross
摘要:建筑、工程和施工(AEC)行业仍然高度依赖存储在设计图中的信息来进行建筑施工、维护、合规性和错误检查。然而,从建筑图纸中提取信息(IE)通常耗时且成本较高,尤其在处理历史建筑时。通过利用图纸标题块中存储的信息,可以简化图纸搜索,这些信息可以被视为图纸的元数据。然而,特别是在处理不符合现有统一标准的历史图纸时,标题块IE可能会变得非常复杂。本工作对这类IE任务现有的方法进行了比较,并提出了一种新颖的标题块检测和IE流水线,该流水线在特定情况下,特别是处理复杂且有噪的历史图纸时,优于现有方法。该流水线通过结合轻量级卷积神经网络和GPT-4o获得。提出的推理流水线以高精度检测建筑工程标题块,并从标题块中提取结构化的图纸元数据,这些元数据可用于图纸搜索、过滤和分组。本工作在矢量(CAD)和手绘(历史)图纸中均展示了高精度和高效率的IE能力。还建立并部署了一个基于提取的元数据的用户界面(UI),用于实际项目中的图纸搜索,这展示了显著的时间节省。此外,通过一种高效的AEC友好的标注工作流开发了一个扩展性强的领域专家标注数据集,为未来工作奠定了基础。