LLM2D

摘要

arXiv:2502.09219v1 类型: cross 摘要: 在本文中，我们研究了一种视觉问答（VQA）问题，其中图像和查询由缺乏领域数据的ASP程序表示。我们提供了一种与现有知识增强技术正交且互补的方法，在该方法中，我们通过过去的例子推导出图像构造的领域关系。在界定 abduction 问题后，我们提供了一种基线方法及其实现，该实现显著提高了查询回答的准确性，但只需要少量示例。