LLM2D

摘要

arXiv:2503.00955v2 通知类型: 替换-交叉摘要：虚假信息的泛滥，尤其受到如GPT和Gemini这样的大型语言模型的加剧，需要强有力的事实核查解决方案，尤其是对于像越南语这样的低资源语言。现有方法在语义模糊性、多义词和复杂语言结构方面捉襟见肘，往往在准确性和效率之间权衡。我们提出了SemViQA，这是一种新颖的越南语事实核查框架，结合了基于语义的证据检索（SER）和两步验证分类（TVC）。我们的方法在精确性和速度之间取得了平衡，我们在ISE-DSC01上以78.97%的严格准确率和ViWikiFC上以80.82%的准确率达到了最先进的结果，在UIT数据科学挑战中获得第一名。此外，SemViQA Faster将推理速度提高了7倍，同时保持了竞争力的准确率。SemViQA为越南语事实核查设定了新的基准，推进了对抗虚假信息的斗争。源代码可在以下地址获得：https://github.com/DAVID-NGUYEN-S16/SemViQA。