摘要
arXiv:2505.04072v1 交叉类型公告
摘要:工具调用是扩展大型语言模型(LLMs)能力的关键机制,并已引起了广泛关注。它使LLMs能够通过工具调用来解决复杂问题,同时获取最新的世界知识。然而,现有的工作主要集中在LLMs调用工具的基本能力上,用于问题解决,而没有考虑个性化约束下的工具调用。在本工作中,我们引入了个性化的工具调用概念,并定义了两个关键任务:工具偏好和基于用户资料的查询。工具偏好解决在选择功能相似的工具时用户的偏好问题,而基于用户资料的查询则考虑了用户查询缺乏某些工具参数的情况,要求模型从用户资料中推断这些参数。为了应对这些挑战,我们提出了PTool,一个专门为个性化工具调用设计的数据合成框架。此外,我们构建了PTBench,这是首个评估个性化工具调用的基准。随后,我们对各种开源模型进行了微调,展示了我们框架的有效性,并提供了宝贵的见解。我们的基准可以在https://github.com/hyfshadow/PTBench获取。