LLM2D

摘要

arXiv:2502.04376v1 宣告类型: 交叉摘要: 在当代的工作场所中，会议对于交流想法和确保团队协调是必不可少的，但往往会面临时间消耗、日程冲突和参与不高效的挑战。近日，大型语言模型（LLMs）在自然语言生成和推理方面的强大能力得到了证明，引发了这样一个问题：LLMs 是否能够有效地安排会议参与者？为了探索这个问题，我们开发了一个基于LLM的会议参与者系统，并创建了一个基于真实会议记录的全面基准。我们的评估显示，GPT-4/4o 在活跃参与和谨慎参与策略之间保持了平衡的表现。相比之下，Gemini 1.5 Pro 更倾向于谨慎参与，而 Gemini 1.5 Flash 和 Llama3-8B/70B 则表现出更多的活跃倾向。总体而言，约 60% 的响应至少涵盖了真实情况中的一项关键点。然而，为进一步减少无关或重复的内容，并提高对常见于实际环境中的转录错误的容忍度，仍需做出改进。另外，我们还在实际环境中实现了该系统，并收集了演示的真实反馈。我们的研究结果强调了利用LLMs作为会议参与者增的潜力和挑战，并提供了有关其在缓解会议负担方面的实际应用的宝贵见解。