LLM2D
提升高效MLLM的隐私域理解:一种无调优、自适应、通用的提示优化框架
Boosting Private Domain Understanding of Efficient MLLMs: A Tuning-free, Adaptive, Universal Prompt Optimization Framework
作者: Jiang Liu, Bolin Li, Haoyuan Li, Tianwei Lin, Wenqiao Zhang, Tao Zhong, Zhelun Yu, Jinghao Wei, Hao Cheng, Wanggui He, Fangxun Shu, Hao Jiang, Zheqi Lv, Juncheng Li, Siliang Tang, Yueting Zhuang
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2412.19684v2

摘要

arXiv:2412.19684v2 宣告类型: 替代 摘要:与多模态大型语言模型(MLLMs)相比,高效的多模态大型语言模型(EMLLMs)减少了模型大小和计算成本,并且通常部署在资源受限的设备上。然而,由于数据隐私问题,现有的开源EMLLMs在预训练过程中很少有访问私人领域特定数据的机会,使得它们难以直接应用于特定设备领域,如某些业务场景。为了弥补这一不足,本文专注于EMLLMs在私人领域的高效适应,具体在两个方面进行:1) 如何减少数据需求,2) 如何避免参数微调。具体而言,我们提出了一个无需微调、适应性强、通用提示优化框架,简称我们的方法(\textit{\ourmethod}),该框架包括两个阶段:1) 预定义提示,基于增强搜索策略,生成提示优化策略树以获取优化先验;2) 提示反射初始化基于优化先验的提示,随后进行自我反思以进一步搜索和优化提示。通过这种方式,\ourmethod优雅地生成处理私人领域特定数据的“理想提示”。需要注意的是,我们的方法不需要参数微调,并且只需要少量数据即可快速适应私人数据的数据分布。在多项任务上的广泛实验表明,与基线方法相比,我们提出的\ourmethod显著提高了效率和性能。