LLM2D
专利领域的自然语言处理:一种综述
Natural Language Processing in the Patent Domain: A Survey
作者: Lekang Jiang, Stephan Goetz
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2403.04105v3

摘要

arXiv:2403.04105v3 通知类型: 重置 摘要:专利包含以文本形式和参考图示封装的重要技术和法律信息,为自然语言处理(NLP)应用提供了丰富的领域。随着NLP技术的发展,大型语言模型(LLMs)在通用文本处理和生成任务中展现了出色的性能。然而,由于专利的复杂性,特别是其语言和法律框架,LLMs 在专利领域的应用仍然未被充分探索和开发。因此,了解专利文档的独特特性和相关研究对于研究人员有效应用这些工具至关重要。因此,本文旨在为NLP研究人员提供导航这一复杂领域的必要知识。我们介绍了与专利相关的基础方面,提供了坚实的基础信息。此外,我们系统地分解了专利的独特结构和语言特性,并绘制出如何利用NLP进行专利分析和生成。此外,我们展示了文本和多模态专利相关任务的光谱,包括九项专利分析和四项专利生成任务。