arXiv 论文列表

作者: Dianwei Chen, Zifan Zhang, Yuchen Liu, Xianfeng Terry Yang

arXiv:2502.00262v2 宣布类型: replace-cross 摘要：自主驾驶系统在处理不可预测的边缘案例场景中面临重大挑战，例如敌对行人的运动、危险的车辆操作以及突然的环境变化。当前的端到端驾驶模型由于传统检测和预测方法的局限性，在这些罕见事件的泛化上面临困难。为了解决这一问题，我们提出了INSIGHT（融合语义和视觉输入的一般危险跟踪），这是一种分层的视觉-语言模型（VLM）框架，旨在增强危险检测和边缘案例评估。通过使用多模态数据融合，我们的方法将语义和视觉表示结合起来，使驾驶场景的精准解释和潜在危险的准确预测成为可能。通过监督微调VLMs，我们使用基于注意力机制和坐标回归技术优化了空间危险定位。在BDD100K数据集上的实验结果表明，与现有模型相比，我们的方法在危险预测的直接性和准确性上取得了显著提高，实现了显著增强的泛化性能。这一进展增强了自主驾驶系统的可靠性和安全性，确保了在复杂现实世界场景中的态势感知和潜在决策的改进。

发布时间: 2/5/2025

查看原文

STP: 自博弈LLM定理证明器与迭代猜想与证明

作者: Kefan Dong, Tengyu Ma

arXiv:2502.00212v2 通知类型: 交叉替换摘要：形式定理证明中使用大型语言模型（LLM）所面临的一个根本挑战是缺乏高质量的训练数据。虽然强化学习或专家迭代部分缓解了这一问题，通过交替使用LLM生成证明和在正确生成的证明上微调它们，但性能很快会停滞不前，原因是对正确证明的稀缺性（稀疏奖励）。为了在有限的数据下继续改进模型，我们从数学家身上汲取灵感，他们通过不断提出新的猜想或练习题（通常是已知结果的变体）并尝试解决它们来不断开发新的成果。我们设计了Self-play Theorem Prover（STP），使其同时承担猜想者和证明者的角色，每个角色为对方提供训练信号。猜想者在经过迭代训练后，专注于难以被当前证明者证明的猜想，这激励它随着时间的推移生成越来越具挑战性的猜想。证明者则尝试使用标准专家迭代来证明这些猜想。我们使用Lean和Isabelle形式验证器来评估STP。在Lean的训练过程中生成了198亿个标记后，STP在LeanWorkbook数据集中的证明率达到了26.3%，超过了通过专家迭代实现的前最佳结果13.2%。最终模型在miniF2F-test（61.1%，pass@3200）、Proofnet-test（23.1%，pass@3200）和PutnamBench（8/644，pass@64）上的表现达到了整个证明生成方法的最新水平。

发布时间: 2/5/2025

查看原文

AlphaSharpe: LLM驱动的稳健风险调整度量发现

作者: Kamer Ali Yuksel, Hassan Sawaf

arXiv:2502.00029v2 通知类型: 替换-交叉摘要：投资绩效评估中，夏普比率等金融指标在权衡风险与收益方面发挥着关键作用。然而，传统指标在稳健性和泛化能力方面通常存在局限性，尤其是在动态和波动的市场条件下。本论文介绍了一种名为AlphaSharpe的新框架，该框架利用大规模语言模型（LLMs）迭代地进化和优化金融指标，以发现超越传统方法的更优风险-收益指标，这些指标通过迭代杂交、变异和评估，在稳健性和与未来绩效指标的相关性方面表现出优越性。该工作的关键贡献包括：（1）首次利用LLMs生成和优化具有隐含领域特定知识的金融指标，（2）一个评分机制以确保进化出的指标能够有效地泛化到未见过的数据，以及（3）实证证明对未来风险-收益的预测能力强三倍，并且在投资组合绩效方面强两倍。在真实数据集上的实验结果突显了发现指标的优越性，这批指标对投资组合管理者和金融决策者来说非常重要。该框架不仅解决了现有指标的局限性，还展示了LLMs在推进金融分析中的潜力，为基于信息和稳健的投资策略铺平了道路。

发布时间: 2/5/2025

查看原文

LLMs与人类专家在需求工程中的分析

作者: Cory Hymel, Hiroe Johnson

arXiv:2501.19297v2 宣告类型: 替换-交叉摘要：关于大型语言模型（LLM）在软件开发中的应用，大多数研究都集中在代码生成方面。在需求工程（RE）领域，涉及到系统需求的开发和验证过程，相关的文献却很少。需求工程中有一个分支是需求获取，这是从用户、客户及其他利益相关者处发现并记录系统需求的过程。在这项分析中，我们将LLM与人类专家在时间限制和提示限制的研究中，获取软件系统需求的能力进行了比较。我们发现，由LLM生成的需求相对于人类生成的需求更为一致（+1.12），且更完整（+10.2%）。相反，用户倾向于认为他们认为更一致的解决方案是由人类专家生成的。此外，虽然LLM生成的文档得分更高，并且速度是人类专家的720倍，但其平均成本仅为人类专家的0.06%。总体而言，这些发现表明，通过改善需求定义、提高资源分配效率并缩短项目时间线，LLM将在需求工程中发挥越来越重要的作用。

发布时间: 2/5/2025

查看原文

多agent大语言系统中的分层思维链提示：一种全面的可解释大语言模型方法

作者: Manish Sanwal

arXiv:2501.18645v2 宣告类型: 替换-交叉摘要：大型语言模型（LLMs）通过链式思考（CoT）提示提供逐步的推理过程，从而在复杂任务上提高性能。尽管有着这些好处，但纯vanilla CoT往往无法充分验证中间的推断，有时还会生成误导性的解释。在本文中，我们提出了层次化链式思考（Layered-CoT）提示，这是一种新颖的框架，该框架系统地将推理过程划分为多个层次，并对每个层次进行外部检查，同时允许可选项的用户反馈。我们扩展了关键概念，并介绍了三个场景——医疗分诊、金融风险评估和敏捷工程——展示了与纯vanilla CoT相比，Layered-CoT在透明度、正确性和用户参与度方面具有优势。通过整合来自最近几篇arXiv论文中关于交互式可解释性、多代理框架以及基于代理的合作的相关参考，我们说明了如何使Layered-CoT为高风险领域提供了更为可靠和实际的解释铺平了道路。

发布时间: 2/5/2025

查看原文

冰山一角：揭示隐藏在提示内在任务 adversarial 攻击类别的 LLMs 攻击

作者: Sergey Berezin, Reza Farahbakhsh, Noel Crespi

arXiv:2501.18626v3 声称类型: replace-cross 摘要：我们提出了一种针对大型语言模型（LLMs）的新颖类别攻击，称为任务在提示（TIP）攻击。我们的方法将序列到序列任务（例如，密码解码、谜语、代码执行）嵌入模型的提示中，以间接生成禁止输入。为了系统地评估这些攻击的有效性，我们引入了PHRYGE基准。我们证明，我们的技术成功地绕过了六种最先进的语言模型（包括GPT-4o和LLaMA 3.2）的安全措施。我们的研究表明，当前LLM安全对齐存在关键弱点，并强调了需要更多复杂防御策略的紧迫需求。警告：本文包含仅用于研究目的的不道德询问示例。

发布时间: 2/5/2025

查看原文

调整大型语言模型法官设计决策的成本至原来的千分之一

作者: David Salinas, Omar Swelam, Frank Hutter

arXiv:2501.17178v2 评估类型：替换-交叉验证摘要：评估大规模语言模型（LLMs）通常需要昂贵的人工注释。为了解决这一问题，已经提出了基于LLM的裁判模型，这些模型能够比较两个LLM的输出，从而在不需要人工干预的情况下对模型进行排名。尽管提出现了一些方法，但在不同的论文中仍存在许多混淆因素。例如，模型、提示和其他超参数通常同时发生变化，这使得直接比较变得颇具挑战性。在本文中，我们提出了一种系统地分析和调整LLM裁判的超参数的方法。为了缓解评估裁判的高成本，我们提出了多目标多精度的方法，这使得在准确性和成本之间进行权衡成为可能，并且显著降低了搜索成本。我们的方法不仅能识别出在准确性和成本效率方面超越现有基准的裁判，还能利用公开权重模型，确保更高的可访问性和可重现性。

发布时间: 2/5/2025

查看原文

使用机器学习发现增材制造飞溅本构模型

作者: Olabode T. Ajenifujah, Amir Barati Farimani

arXiv:2501.08922v2 宣布类型：替换交叉摘要：增材制造（AM）是一种迅速发展的技术，由于其能够制造复杂几何形状的能力，已在广泛领域吸引了应用。然而，在AM中，实现一致的打印质量是一个关键挑战。这种不一致性通常归因于无法控制的熔池动态，部分原因是飞溅引起的缺陷。因此，捕获和控制熔池的演变对于提高工艺稳定性和零件质量至关重要。在本研究中，我们开发了一个框架，以支持高效AM工艺操作的决策，该框架通过机器学习（ML）和多项式符号回归模型能够促进质量控制并最小化缺陷。我们实现了实验验证的计算工具，特别是针对激光 Powder Bed Fusion（LPBF）过程，作为一种成本效益高的方法来收集大量数据集。对于包含281种不同工艺条件的数据集，提取了熔池尺寸（长度、宽度、深度）、熔池几何形状（面积、体积）和指示飞溅的体积参数。使用机器学习（ML）和多项式符号回归模型，分别在训练数据集和测试数据集上实现了超过95%的高R2预测熔池尺寸和几何特征，以工艺条件（功率和速度）或熔池尺寸作为模型输入。对于指示飞溅的体积，模型输入 logarithmic 转换后，R2值有所提高，这些输入可以是工艺条件或熔池尺寸。在研究的机器学习模型中，ExtraTree模型获得了最高的R2值，分别为96.7%和87.5%。

发布时间: 2/5/2025

查看原文

在低带宽分区下于Frontier上规模化语言模型训练

arXiv:2501.04266v2 通知类型: 替换-交叉摘要：扩大大型语言模型（LLM）训练涉及将大量训练参数分布在有限数量的工人中。然而，像ZeRO-3这样的方法虽然大幅减少了GPU内存压力，但往往需要大量的通信以确保全局同步和一致性。现有的努力如ZeRO++使用次级分区来避免节点间通信，因为在节点内GPU-GPU传输通常具有更高的带宽和更低的延迟。然而，随着像Frontier这样的更加先进的基础设施出现，配备了AMD GPU的设施具有令人印象深刻的计算能力，因此有必要对硬件拓扑进行调查，并开发有针对性的策略以提高训练效率。在这项工作中，我们提出了一系列ZeRO++的通信和优化策略，以减少通信成本并提高内存利用率。在这项论文中，我们专门为当前排名第二的超级计算集群Frontier提出了三层分层次分区，旨在利用不同层通信（GCD-GCD、GPU-GPU 和节点间）中的各种带宽来减少通信开销。对于一个20B的GPT模型，与ZeRO++中的384 GCD相比，我们观察到每GPU的TFLOPS增加了1.71倍，并且对于最多384 GCD，扩展效率为0.94。

发布时间: 2/5/2025

查看原文

TrojanDec：自我监督学习中特洛伊木马输入的无数据检测

作者: Yupei Liu, Yanting Wang, Jinyuan Jia

arXiv:2501.04108v2 安全公告类型: 替换-交叉摘要：通过自我监督学习预训练的图像编码器可以作为通用特征提取器，用于构建各种下游任务的下游分类器。然而，许多研究显示，攻击者可以将一个特洛伊木马嵌入到编码器中，使得基于被污染编码器构建的多个下游分类器同时继承了特洛伊木马的行为。本文中，我们提出了 TrojanDec，这是一个数据无关的方法，用于识别并恢复嵌入触发器的测试输入。给定一个（被污染的或干净的）编码器和一个测试输入，TrojanDec 首先预测测试输入是否被污染。如果不是，测试输入将以正常方式进行处理以保持其实用价值。否则，测试输入将被进一步恢复以移除触发器。我们的广泛评估显示，TrojanDec 可以有效地从给定的测试输入中识别出（如果有）特洛伊木马，并在最新的特洛伊木马攻击下恢复它。我们进一步通过实验展示了我们的 TrojanDec 在性能上优于最先进的防御方法。

发布时间: 2/5/2025

查看原文