LLM2D

摘要

arXiv:2505.04072v1 交叉类型公告摘要：工具调用是扩展大型语言模型（LLMs）能力的关键机制，并已引起了广泛关注。它使LLMs能够通过工具调用来解决复杂问题，同时获取最新的世界知识。然而，现有的工作主要集中在LLMs调用工具的基本能力上，用于问题解决，而没有考虑个性化约束下的工具调用。在本工作中，我们引入了个性化的工具调用概念，并定义了两个关键任务：工具偏好和基于用户资料的查询。工具偏好解决在选择功能相似的工具时用户的偏好问题，而基于用户资料的查询则考虑了用户查询缺乏某些工具参数的情况，要求模型从用户资料中推断这些参数。为了应对这些挑战，我们提出了PTool，一个专门为个性化工具调用设计的数据合成框架。此外，我们构建了PTBench，这是首个评估个性化工具调用的基准。随后，我们对各种开源模型进行了微调，展示了我们框架的有效性，并提供了宝贵的见解。我们的基准可以在https://github.com/hyfshadow/PTBench获取。