LLM2D

摘要

arXiv:2502.01673v1 交叉领域类型: 自然语言处理 (NLP) 摘要：印地语族语言的多样性和复杂性为自然语言处理 (NLP) 任务，特别是在问答 (QA) 领域带来了独特的挑战。为了应对这些挑战，本文探讨了状态空间模型 (SSMs) 在构建适合印地语族语言的高效且上下文感知的问答系统方面的应用。SSMs 特别适合这项任务，因为它们能够建模序列数据中的长期和短期依赖关系，使它们能够很好地处理印度语言中丰富多彩的形态学、复杂的句法以及上下文中的复杂性。我们在多种印地语族语言的多样数据集上评估了多个 SSM 架构，并对其性能进行了比较分析。我们的结果表明，这些模型有效地捕捉到了语言的细微之处，从而在问题解释、上下文对齐和答案生成方面取得了显著改进。这项工作代表了状态空间模型首次应用于印地语族语言的问答任务，为未来在这个领域的研究建立了基础基准。我们提出了现有 SSM 框架的改进，以优化其在资源有限的环境和印地语族语言中普遍存在的多语言场景中的应用。