LLM2D
SemViQA: 一种用于越南语信息事实核查的语义问答系统
SemViQA: A Semantic Question Answering System for Vietnamese Information Fact-Checking
作者: Dien X. Tran, Nam V. Nguyen, Thanh T. Tran, Anh T. Hoang, Tai V. Duong, Di T. Le, Phuc-Lu Le
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2503.00955v2

摘要

arXiv:2503.00955v2 通知类型: 替换-交叉 摘要:虚假信息的泛滥,尤其受到如GPT和Gemini这样的大型语言模型的加剧,需要强有力的事实核查解决方案,尤其是对于像越南语这样的低资源语言。现有方法在语义模糊性、多义词和复杂语言结构方面捉襟见肘,往往在准确性和效率之间权衡。我们提出了SemViQA,这是一种新颖的越南语事实核查框架,结合了基于语义的证据检索(SER)和两步验证分类(TVC)。我们的方法在精确性和速度之间取得了平衡,我们在ISE-DSC01上以78.97%的严格准确率和ViWikiFC上以80.82%的准确率达到了最先进的结果,在UIT数据科学挑战中获得第一名。此外,SemViQA Faster将推理速度提高了7倍,同时保持了竞争力的准确率。SemViQA为越南语事实核查设定了新的基准,推进了对抗虚假信息的斗争。源代码可在以下地址获得:https://github.com/DAVID-NGUYEN-S16/SemViQA。