LLM2D
从文本中识别语法模式以提取抽象维度
Extracting Abstraction Dimensions by Identifying Syntax Pattern from Texts
作者: Jian Zhou, Jiazheng Li, Sirui Zhuge, Hai Zhuge
发布日期: 5/2/2025
arXiv ID: oai:arXiv.org:2505.00027v1

摘要

arXiv:2505.00027v1 Announce Type: cross 摘要:本文提出了一种自动从文本中发现主题维度、动作维度、客体维度和副词维度的方法,以高效地操作文本并支持自然语言查询。高质量的树保证了文本中所有主题、动作、客体和副词及其子类关系都可以被表示。树的独立性保证了树之间没有冗余表示。树的表达性保证了大多数句子可以从每棵树中访问到,其余的句子可以从至少一棵树中访问到,从而使基于树的搜索机制能够支持自然语言查询。实验表明,由主题、动作、客体和副词的子类关系构建的抽象树的平均查准率、查全率和F1分数都大于80%。提出的这种方法在支持自然语言查询方面的应用表明,不同类型的查询模式对于查询主题或客体具有很高的文本覆盖率,根据查询模式在主题、动作、客体和副词上搜索多棵树可以迅速减少搜索空间以定位目标句子,从而支持对文本的精准操作。