LLM2D
长篇视频问答中的全局语义编码与控制
Encoding and Controlling Global Semantics for Long-form Video Question Answering
作者: Thong Thanh Nguyen, Zhiyuan Hu, Xiaobao Wu, Cong-Duy T Nguyen, See-Kiong Ng, Anh Tuan Luu
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2405.19723v3

摘要

大型语言模型 (LLM) 已取代传统方法,成为众多自然语言处理任务的首选。然而,在命名实体识别 (NER) 中,现有的基于 LLM 的方法...