LLM2D
多模态大型语言模型上的视觉问题分解
Visual Question Decomposition on Multimodal Large Language Models
作者: Haowei Zhang, Jianzhe Liu, Zhen Han, Shuo Chen, Bailan He, Volker Tresp, Zhiqiang Xu, Jindong Gu
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19339v1

摘要

大型语言模型(LLMs)在许多自然语言处理任务中已经取代了传统方法。然而,在命名实体识别(NER)方面,现有的基于LLMs的方法...