LLM2D
VLLFL:基于视觉语言模型的轻量联邦学习框架应用于智能农业
VLLFL: A Vision-Language Model Based Lightweight Federated Learning Framework for Smart Agriculture
作者: Long Li, Jiajia Li, Dong Chen, Lina Pu, Haibo Yao, Yanbo Huang
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2504.13365v1

摘要

arXiv:2504.13365v1 类型: cross 摘要:在现代智能农业中,目标检测发挥着关键作用,通过实现自动化、精确农业和资源监控。从识别作物健康状况和病虫害到优化收获过程,精确的目标检测既提高了生产效率,也提高了可持续性。然而,训练目标检测模型通常需要大规模的数据收集,并且当敏感的农业数据分散在各个农场时,会引发隐私问题。为了解决这些问题,我们提出了一种基于视觉语言模型的轻量级联邦学习框架(VLLFL)。该框架利用视觉语言模型(VLM)的一般化和上下文感知检测能力,并借助于联邦学习的隐私保护特性。通过训练一个紧凑的提示生成器来提升部署在不同农场的VLM的性能,VLLFL 在保持隐私的同时减少了通信开销。实验结果表明,VLLFL 在提升VLM性能方面取得了14.53%的改进,同时减少了99.3%的通信开销。涵盖从识别各种水果到检测农业中的有害动物等多种任务,该提出的框架提供了一种高效、可扩展且针对农业应用的隐私保护解决方案。