LLM2D
Home
Arxiv
返回列表
第二届感知测试挑战赛多选视频问答赛道第一名解决方案
First Place Solution to the Multiple-choice Video QA Track of The Second Perception Test Challenge
发布日期:
9/23/2024
arXiv ID:
oai:arXiv.org:2409.13538v1
摘要
arXiv:2409.13538v1 公告类型: 交叉 摘要: 在本报告中,我们介绍了在第二届感知测试挑战赛中多选视频问答赛道的第一名解决方案。该竞赛提出了一项复杂的视频理解任务,要求模型准确理解和回答有关视频内容的问题。为应对这一挑战,我们利用了强大的QwenVL2(7B)模型,并在提供的训练集上对其进行了微调。此外,我们还采用了模型集成策略和测试时间增强技术以提升性能。通过持续优化,我们的方法在排行榜上达到了0.7647的Top-1准确率。
查看原文
下载 PDF