LLM2D
从数据中 abduction 领域关系以用于 VQA
Abduction of Domain Relationships from Data for VQA
作者: Al Mehdi Saadat Chowdhury, Paulo Shakarian, Gerardo I. Simari
发布日期: 2/14/2025
arXiv ID: oai:arXiv.org:2502.09219v1

摘要

arXiv:2502.09219v1 类型: cross 摘要: 在本文中,我们研究了一种视觉问答(VQA)问题,其中图像和查询由缺乏领域数据的ASP程序表示。我们提供了一种与现有知识增强技术正交且互补的方法,在该方法中,我们通过过去的例子推导出图像构造的领域关系。在界定 abduction 问题后,我们提供了一种基线方法及其实现,该实现显著提高了查询回答的准确性,但只需要少量示例。