LLM2D

长篇视频问答中的全局语义编码与控制

Encoding and Controlling Global Semantics for Long-form Video Question Answering

作者: Thong Thanh Nguyen, Zhiyuan Hu, Xiaobao Wu, Cong-Duy T Nguyen, See-Kiong Ng, Anh Tuan Luu

发布日期: 10/8/2024

arXiv ID: oai:arXiv.org:2405.19723v3

大型语言模型 (LLM) 已取代传统方法，成为众多自然语言处理任务的首选。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法...