arXiv 论文列表

作者: Jie Zou, Mohammad Aliannejadi, Evangelos Kanoulas, Shuxi Han, Heli Ma, Zheng Wang, Yang Yang, Heng Tao Shen

arXiv:2502.13881v1 宣告类型：交叉摘要：对话式产品搜索（CPS）受限于模拟对话，因为缺乏反映人类语言的现实世界 CPS 数据集。此外，当前的对话式数据集在支持跨市场和多语言使用方面也受到限制。在本文中，我们介绍了新的 CPS 数据收集协议并提出了 PSCon，这是一个新型 CPS 数据集，旨在通过类似人类的对话辅助产品搜索。该数据集是使用教练指导的人对人数据收集协议构建的，支持两种语言和两个市场。此外，该数据集使我们可以全面探索 CPS 的六个子任务：用户意图检测、关键词提取、系统动作预测、问题选择、商品排名和响应生成。此外，我们还对数据集进行了分析，并在提出的 CPS 数据集上提出了一个基准模型。

发布时间: 2/20/2025

查看原文

MEX: 记忆高效的方法实现多对象跟踪

作者: Huu-Thien Tran, Phuoc-Sang Pham, Thai-Son Tran, Khoa Luu

arXiv:2502.13875v1 Announce Type: 横跨领域摘要: 引用多对象跟踪（RMOT）是一个相对较新的概念，它作为一种在计算机视觉和自然语言处理交叉领域有潜力的研究方向而迅速引起了关注。与传统的多对象跟踪不同，RMOT 识别并跟踪对象，并结合了对象类别的文本描述，使得这种方法更具直观性。为了应对这一挑战性的问题，已提出了多种技术；然而，大多数方法由于其端到端的性质，需要对整个网络进行训练。在这些方法中，iKUN 已经展现出特别有前景的解决方案。因此，我们进一步探索其管道并增强其性能。在本文中，我们介绍了一种被称为高效跨模态——MEX 的实用模块。这种高效的技术可以直接应用于现成的跟踪器如 iKUN，从而带来显著的架构改进。我们的方法在单个带有 4 GB 内存的 GPU 上进行推断时证明了其有效性。在各种基准测试中，特别有用的是提供多样化的自主驾驶场景并带有相关语言表达的 Refer-KITTI 数据集，它特别适用于研究这一问题。实证研究表明，我们的方法在 HOTA 跟踪评分方面表现出有效性与效率，显著提高了内存分配和处理速度。

发布时间: 2/20/2025

查看原文

NVR：向量前瞻以优化NPUs中的稀疏内存访问

作者: Hui Wang, Zhengpeng Zhao, Jing Wang, Yushu Du, Yuan Cheng, Bing Guo, He Xiao, Chenhao Ma, Xiaomeng Han, Dean You, Jiapeng Guan, Ran Wei, Dawei Yang, Zhe Jiang

arXiv:2502.13873v1 交叉类型: cross 摘要: 深度神经网络越来越多地利用稀疏性来减少模型参数大小的放大。然而，通过稀疏性和剪枝来减少墙钟时间仍然是一个挑战，这是因为不规则的内存访问模式导致频繁的Cache缺失。本文中，我们提出了NPU向量前瞻(NPU Vector Runahead, NVR)机制，这是一种专门为NPU设计的预取机制，旨在解决稀疏DNN工作负载中的Cache缺失问题。NVR 不是通过高开销和低可移植性的方法优化内存模式，而是将前瞻执行适应NPU的独特架构。NVR 提供了一种通用的微架构级解决方案，适用于稀疏DNN工作负载，无需编译器或算法支持，作为一个与NPU解耦的、推测性的、轻量级的硬件子线程运行，硬件开销在5%以下。NVR 达到了与通用处理器最新预取技术相比平均90%的Cache缺失减少，且在不需要预取的情况下，提升了NPU上稀疏工作负载的平均4倍性能。此外，我们还研究了在NPU中加入一个小容量Cache（16KB）与NVR结合的优劣。我们的评估结果显示，扩展这个较小的Cache带来的性能提升比增加相同数量的L2 Cache大小高出5倍。

发布时间: 2/20/2025

查看原文

SPEX: 扩展特征交互解释以适应大语言模型

作者: Justin Singh Kang, Landon Butler, Abhineet Agarwal, Yigit Efe Erginbas, Ramtin Pedarsani, Kannan Ramchandran, Bin Yu

arXiv:2502.13870v1 通知类型: cross 摘要：大型语言模型（LLMs）因其能够捕捉输入特征之间的复杂交互而彻底改变了机器学习。流行的后 hoc 解释方法如 SHAP 提供了边缘特征归属，而其交互重要性扩展仅适用于较短的输入长度（约 20 个）。我们提出了频谱解释器（SPEX），这是一种模型无关的交互归属算法，可以高效地扩展到较大的输入长度（约 1000 个）。SPEX 利用了交互中固有的自然稀疏性——在现实世界数据中常见——并使用信道解码算法应用稀疏傅里叶变换，以高效地识别重要交互。我们在三个具有挑战性的长上下文数据集上进行了实验，这些数据集需要 LLMs 利用输入之间的交互来完成任务。对于大型输入，SPEX 在忠实地重构 LLM 输出方面比边缘归属方法高出 20%。此外，SPEX 成功识别出对模型输出产生重大影响的关键特征和交互。对于我们的一个数据集 HotpotQA，SPEX 提供的交互与人类注释相吻合。最后，我们使用我们的模型无关方法生成解释以展示闭源 LLMs（GPT-4o mini）的抽象推理能力以及视觉语言模型的组合推理能力。

发布时间: 2/20/2025

查看原文

DH-RAG：一种基于动态历史语境的检索增强生成方法用于多轮对话

作者: Feiyuan Zhang, Dezhi Zhu, James Ming, Yilun Jin, Di Chai, Liu Yang, Han Tian, Zhaoxin Fan, Kai Chen

arXiv:2502.13847v1 交叉类型摘要：检索增强生成（RAG）系统在问答和多轮对话等应用中显示出了显著的优势[参考文献lewis2020retrieval]。然而，传统的RAG方法虽然利用了静态知识库，但常常忽视了正在进行对话中的动态历史信息的潜力。为了解决这一问题，我们引入了DH-RAG，这是一种基于动态历史上下文的检索增强生成方法，适用于多轮对话。DH-RAG灵感来源于人类认知过程，该过程在对话响应中利用了长期记忆和即时历史上下文[参考文献stafford1987conversational]。DH-RAG围绕两个主要组成部分构建：一个基于历史学习的查询重建模块，旨在通过综合当前和先前的交互生成有效的查询，以及一个动态历史信息更新模块，该模块在整个对话过程中不断刷新历史上下文。DH-RAG的核心是一个动态历史信息数据库，该数据库进一步由查询重建模块内的三种策略进行优化：历史查询聚类、层次匹配和思维链跟踪。实验评估表明，DH-RAG在多个基准上显著超越了传统模型，提高了响应的相关性、连贯性和对话质量。

发布时间: 2/20/2025

查看原文

通过个性化推理增强基于LLM的推荐

作者: Jiahao Liu, Xueshuo Yan, Dongsheng Li, Guangping Zhang, Hansu Gu, Peng Zhang, Tun Lu, Li Shang, Ning Gu

arXiv:2502.13845v1 类型: cross 摘要: 当前由大规模语言模型（LLMs）驱动的推荐系统往往因为缺乏明确的逻辑结构而未能充分利用其推理能力。为了解决这一限制，我们引入了CoT-Rec框架，该框架通过整合Chain-of-Thought（CoT）推理将LLM驱动的推荐系统结合起来，其中包括两个关键过程：用户偏好分析和项目感知评估。CoT-Rec分为两个关键阶段运行：（1）个性化数据提取，其中识别用户偏好和项目感知，以及（2）个性化数据分析应用，其中利用这些信息来细化推荐。我们的实验分析表明，CoT-Rec通过更好地利用LLMs的推理潜力提高了推荐准确性。实现代码已公开，可在https://anonymous.4open.science/r/CoT-Rec获取。

发布时间: 2/20/2025

查看原文

用内存优化的LLM基用户代理增强跨域推荐

作者: Jiahao Liu, Shengkang Gu, Dongsheng Li, Guangping Zhang, Mingzhe Han, Hansu Gu, Peng Zhang, Tun Lu, Li Shang, Ning Gu

arXiv:2502.13843v1 Announce Type: cross 摘要：基于大型语言模型（LLM）的用户代理已经成为了通过模拟用户交互来改进推荐系统的一种强大工具。然而，现有方法在跨域场景中遇到困难，主要是由于低效的内存结构，导致无关信息保留，并且无法考虑到诸如流行度等社会影响因素。为了解决这些问题，我们引入了AgentCF++这一新的框架，该框架具有双层内存结构和两步融合机制，以有效过滤领域的特定偏好。此外，我们提出了共享内存的兴趣组，使得模型能够捕捉到类似兴趣用户受到流行趋势影响的效果。通过在多个跨域数据集上的广泛实验，AgentCF++在基线模型上表现出优越的性能，突显了其在细化推荐系统中用户行为模拟方面的有效性。我们的代码可在https://anonymous.4open.science/r/AgentCF-plus获取。

发布时间: 2/20/2025

查看原文

通过公平抽样减轻协作过滤中的流行性偏见

作者: Jiahao Liu, Dongsheng Li, Hansu Gu, Peng Zhang, Tun Lu, Li Shang, Ning Gu

arXiv:2502.13840v1 宣告类型：交叉摘要：推荐系统通常会遭受流行性偏差的问题，即频繁交互的项目在推荐中过度代表。这种偏差源于影响训练数据的倾向性因素，导致曝光不均衡。在本文中，我们提出了一种公平采样（FS）方法，以通过确保用户和项目以相同概率作为正样本和负样本来解决这个问题。与传统的逆倾向得分（IPS）方法不同，FS不需要进行倾向性估计，从而消除了与不准确计算相关的错误。我们的理论分析表明，FS有效地抵消了倾向性因素的影响，实现了无偏的学习。实验结果验证了FS在点对点和成对推荐任务中均优于最先进的方法，提高了推荐的公平性而不牺牲准确性。实现可用在 https://anonymous.4open.science/r/Fair-Sampling。

发布时间: 2/20/2025

查看原文

量化检索增强视觉语言模型中记忆化和检索器性能

作者: Peter Carragher, Abhinand Jha, R Raghav, Kathleen M. Carley

arXiv:2502.13836v1 交叉类型公告摘要：大语言模型（LLMs）在问答（QA）方面展现出了令人瞩目的能力，但评估其依赖记忆与检索（记忆化与检索）的现有指标仍相当欠缺。此外，虽然微调模型在封闭域任务上达到最先进的水平，但通用模型如GPT-4o在零样本表现上非常优秀。这引发了对记忆化、泛化与检索之间权衡取舍的质疑。在此项工作中，我们分析了多模态检索增强VLM相较于基线VLM在训练数据记忆化程度上的差异。使用WebQA基准测试，我们将微调模型与基线VLM在多跳检索和问答方面进行对比，探讨微调对数据记忆化的影响。为了量化端到端检索和问答系统中的记忆化程度，我们通过调查问答成功而检索失败的实例，提出了一些代理指标。我们的结果揭示了微调模型对记忆化的依赖程度。相比之下，检索增强的VLM的记忆化得分较低，但准确性有所下降（WebQA测试集上为72% vs 52%）。因此，我们的度量标准为未来工作在开放域问答和联合检索-问答任务中协调记忆化与泛化带来了挑战。

发布时间: 2/20/2025

查看原文

AnDB：以AI原生数据库打破边界进行通用语义分析

作者: Tianqing Wang, Xun Xue, Guoliang Li, Yong Wang

arXiv:2502.13805v1 Announce Type: cross 摘要：在此次演示中，我们介绍了AnDB，这是一种AI原生数据库，支持传统的OLTP工作负载和创新的AI驱动任务，能够在结构化和非结构化数据中实现统一的语义分析。虽然结构化数据的分析已经成熟，但在用户查询和非结构化数据之间实现语义关联仍然存在挑战。AnDB通过利用前沿的AI原生技术解决了这些问题，让用户可以使用直观的SQL样式的语句进行语义查询，而无需具备AI专业知识。这种方法消除了传统文本到SQL系统的歧义性，并提供了从数据类型到另一种类型无缝优化的全栈分析能力。AnDB通过生成多个执行计划并根据用户的策略和内部优化机制选择最佳计划，实现了查询处理的自动化。AnDB确保了数据管理基础设施的未来兼容性，使用户能够有效地利用各种类型的数据而无需重新从零开始。

发布时间: 2/20/2025

查看原文