摘要
arXiv:2503.00955v2 通知类型: 替换-交叉
摘要:虚假信息的泛滥,尤其受到如GPT和Gemini这样的大型语言模型的加剧,需要强有力的事实核查解决方案,尤其是对于像越南语这样的低资源语言。现有方法在语义模糊性、多义词和复杂语言结构方面捉襟见肘,往往在准确性和效率之间权衡。我们提出了SemViQA,这是一种新颖的越南语事实核查框架,结合了基于语义的证据检索(SER)和两步验证分类(TVC)。我们的方法在精确性和速度之间取得了平衡,我们在ISE-DSC01上以78.97%的严格准确率和ViWikiFC上以80.82%的准确率达到了最先进的结果,在UIT数据科学挑战中获得第一名。此外,SemViQA Faster将推理速度提高了7倍,同时保持了竞争力的准确率。SemViQA为越南语事实核查设定了新的基准,推进了对抗虚假信息的斗争。源代码可在以下地址获得:https://github.com/DAVID-NGUYEN-S16/SemViQA。