LLM2D
印地语语言族多语言状态空间模型在结构化问答中的应用
Multilingual State Space Models for Structured Question Answering in Indic Languages
作者: Arpita Vats, Rahul Raja, Mrinal Mathur, Vinija Jain, Aman Chadha
发布日期: 2/5/2025
arXiv ID: oai:arXiv.org:2502.01673v1

摘要

arXiv:2502.01673v1 交叉类型公告 摘要:印地语的语言多样性和复杂性为自然语言处理(NLP)任务,尤其是在问答(QA)领域,带来了独特的挑战。为了应对这些挑战,本文探讨了状态空间模型(SSMs)的应用,以构建适合印地语的高效且语境敏感的问答系统。由于SSMs能够建模序列数据中的长期依赖和短期依赖,它们特别适合处理印度语言特有的丰富形态、复杂的句法以及上下文细微差别。我们评估了多种SSM架构在代表各种印地语的多元数据集上的性能,并进行了它们性能的比较分析。实验结果表明,这些模型能够有效地捕捉语言上的细微差异,从而显著提高问题解释、上下文对齐和答案生成的效果。这项工作是SSMs首次应用于印地语的问答任务,为该领域的未来研究奠定了基础基准。我们还提出了现有SSM框架的改进,以便更好地适应印度语言中常见的低资源环境和多语言场景。