LLM2D

摘要

arXiv:2503.21902v1 宣布类型: 新摘要: 本体对齐（OA）是实现跨异构知识系统的语义互操作性的基础。我们介绍了一种全面、模块化且稳健的 Python 工具包 OntoAligner，旨在解决现有工具面临的实践限制。现有工具在可扩展性、模块化以及与最近的人工智能进步集成方面存在局限性。OntoAligner 提供了一种灵活的架构，整合了现有的轻量级 OA 技术，如模糊匹配，但更进一步地支持带有检索增强生成和大规模语言模型的当代方法进行 OA。该框架优先考虑可扩展性，使研究人员能够集成自定义对齐算法和数据集。本文详细介绍了 OntoAligner 的设计原则、架构和实现，并通过标准 OA 任务基准测试展示了其实用性。我们的评估突显了 OntoAligner 能够以少量代码高效处理大规模本体，同时提供高质量的对齐。通过开源 OntoAligner，我们旨在为 OA 社区提供一个资源，促进创新和合作，使研究人员和从业人员能够利用该工具包进行可重复的 OA 研究和实际应用。