LLM2D

摘要

arXiv:2504.07994v1 类型: cross 摘要：基于本体的提问生成是语义感知系统的重要应用，能够为各种教学环境创建大量问题库。这些系统的有效性，无论是生成的问题的质量还是认知难度，都很大程度上依赖于底层本体的质量和建模方法，因此评估其适合于这一任务的能力至关重要。到目前为止，尚无人全面调查哪些具体本体方面或特征会影响提问生成过程。因此，本文提出了一套评估本体适合于教学环境中的自动提问生成任务的要求和任务特定指标。利用ROMEO方法，一种用于推导任务特定指标的结构化框架，采用专家导向的方法评估了多种本体在自动提问生成（AQG）任务中的性能，随后对这些本体进行了评估。我们的结果表明，本体特征显著影响提问生成的有效性，不同本体展现了不同的性能水平。这突显了评估本体质量以适应AQG任务的重要性。