LLM2D

摘要

arXiv:2504.13365v1 类型: cross 摘要：在现代智能农业中，目标检测发挥着关键作用，通过实现自动化、精确农业和资源监控。从识别作物健康状况和病虫害到优化收获过程，精确的目标检测既提高了生产效率，也提高了可持续性。然而，训练目标检测模型通常需要大规模的数据收集，并且当敏感的农业数据分散在各个农场时，会引发隐私问题。为了解决这些问题，我们提出了一种基于视觉语言模型的轻量级联邦学习框架（VLLFL）。该框架利用视觉语言模型（VLM）的一般化和上下文感知检测能力，并借助于联邦学习的隐私保护特性。通过训练一个紧凑的提示生成器来提升部署在不同农场的VLM的性能，VLLFL 在保持隐私的同时减少了通信开销。实验结果表明，VLLFL 在提升VLM性能方面取得了14.53%的改进，同时减少了99.3%的通信开销。涵盖从识别各种水果到检测农业中的有害动物等多种任务，该提出的框架提供了一种高效、可扩展且针对农业应用的隐私保护解决方案。