arXiv:2505.08148v1 交叉类型: cross
摘要: 数百万用户利用领先模型提供商开发的基于生成预训练变换器(GPT)的语言模型来完成各种任务。为了支持增强的用户交互和自定义,许多平台——如OpenAI现如今允许开发人员通过专用仓库或应用程序商店创建并发布定制的模型实例,即所谓的自定义GPT。这些自定义GPT使用户能够浏览和与设计用于满足特定需求的专业应用进行交互。然而,随着自定义GPTs的采用不断增加,对其安全漏洞的担忧也在加剧。现有关于这些漏洞的研究大部分仍处于理论层面,往往缺乏关于相关风险的实证、大规模和统计上严谨的评估。
在这项研究中,我们分析了14,904个自定义GPT,评估了它们对七种可利用威胁(如角色扮演攻击、系统提示泄漏、钓鱼内容生成和恶意代码合成)的易感性,这些威胁涵盖了OpenAI市场内各种类别和受欢迎程度的软件。我们引入了一个多指标排名系统来检查自定义GPT的受欢迎程度与其相关安全风险之间的关系。
我们的研究结果显示,超过95%的自定义GPT缺乏足够的安全保护。最常见的漏洞包括基于角色扮演的漏洞(96.51%)、系统提示泄漏(92.20%)和钓鱼(91.22%)。此外,我们还证明了OpenAI的基础模型本身存在着固有的安全弱点,这些弱点经常在自定义GPT中被继承或放大。这些结果突显了加强安全措施和严格内容审查的紧迫需求,以确保基于GPT的应用程序的安全部署。
arXiv:2505.08143v1 文本类型: cross
摘要: 随著大型语言模型(LLMs)在信息辅助中的广泛应用,考察它们与人类沟通风格和价值观的契合度变得尤为重要。鉴于矫正错误观念和建立信任的关键挑战,我们把这项研究置于事实核查健康信息的背景下进行。最近的研究探索了LLM在健康沟通中的潜力,但LLMs和人类专家之间的风格差异以及相关读者的感知仍鲜有研究。鉴于此,本研究评估了LLMs的沟通风格,重点关注它们在健康沟通三项核心要素:信息、发送者和接收者方面的解释与人类的不同。我们收集了来自权威事实核查组织的1498个健康误导信息解释,并生成了对不准确健康信息的LLM回应。参考健康沟通理论,我们从信息语言特征、发送者说服策略和接收者价值观对齐这三大关键维度评估了沟通风格。此外,我们通过盲评方式对99名参与者进行了人类感知评估。研究结果表明,LLM生成的文章在诱说服策略、确定性表达及价值观和道德基础的对齐方面表现较差。然而,人类评价表明对LLM内容有强烈的偏好,超过60%的回应认为LLM文章在清晰度、完整性及说服力方面更优。我们的结果表明,尽管在事实核查和健康沟通的传统质量衡量标准上得分较低,但LLMs的结构化信息呈现方式可能更有效地吸引读者。
arXiv:2505.08138v1 交叉类型公告
摘要:机器遗忘方法会采用一个在数据集上训练的模型和一个遗忘集,然后尝试生成一个仿佛仅使用不在遗忘集中的示例进行训练的模型。我们通过实验证明,对手能够区分镜像模型(通过重新训练而没有遗忘的数据生成的控制模型)和通过遗忘方法生成的模型。这些区分是在文献中代表性遗忘方法的基础上进行的。我们基于文献中的评估得分(即成员推理得分)和Kullback-Leibler散度构建了区分算法。
我们提出了一个关于机器遗忘的强烈形式定义,称为计算遗忘。计算遗忘是指对手无法区分镜像模型和通过遗忘方法生成的模型的能力。如果对手不能在随机猜测之外有更好的表现(除了以可忽略的概率),我们就说一个遗忘方法实现了计算遗忘。
我们的计算遗忘定义为证明遗忘可行性结果提供了理论结构。例如,我们的计算遗忘定义直接表明,对于熵学习算法,不存在确定性的计算遗忘方法。我们还探讨了基于差分隐私(DP)的遗忘方法与计算遗忘之间的关系,展示了在牺牲极端用处坍塌的情况下,基于DP的方法可以满足计算遗忘。这些结果表明,文献中现有的方法在本质上未能实现计算遗忘。最后,我们确定了一些未来工作的开放性问题。
arXiv:2505.08135v1 类型:交叉学科
摘要:我们探讨了使用AI来革新高性能计算(HPC)软件开发所面临的挑战,并提出了研究方向。特别是大型语言模型,AI技术已经彻底改变了软件开发的各个方面。而HPC软件被称为一个独特而专门的科学领域。我们讨论了利用最先进的AI技术开发这样一种独特且小众软件所面临的挑战,并概述了由美国能源部资助的通过AI推进HPC软件的Ellora和Durban两个项目的研究方向。
arXiv:2505.08133v1 宣布类型: 交叉学科
摘要:许多研究着重探讨美国联邦机构如何通过立法和内部使用政策来治理人工智能(AI)。但机构还有一种未被注意到的AI治理角色:当他们指导数十亿美元的联邦财政援助时,制定酌情拨款政策。这些资金使州和地方实体能够研究、创建和使用AI。这些资金不仅用于专门的AI项目,而且还在满足常规拨款目标的过程中,机构使用AI。作为酌情拨款机构,机构指导和限制拨款获奖者的行为——这是一个隐藏的AI治理杠杆。机构通过设定项目目标、评估标准和AI使用限制来拉动这个杠杆。我们使用Grants.gov上2009年至2024年间发布的超过40,000份非国防联邦拨款资助机会的通知文档(NOFO),分析机构如何监管拨款获得者的AI使用。我们选择提到了AI的记录,审查其声明的目标和要求。我们发现机构在通知叙述中促进AI的应用,以其他拨款政策记录可能无法捕捉的方式来塑造其采用。在提到AI的拨款机会中,我们发现仅有少数具体的评估标准或限制。即使在机构在影响个人权利的背景下资助AI用例时,甚至在其与类似联邦采购制度的情况下会带来额外监督时,这种沉默仍然存在。这些发现重新定义了拨款通知作为AI政策制定的场所——尽管这种政策制定与其它监管努力处于不同步的状态,并且在其透明度、问责制和隐私保护方面的考虑是不完整的。文章最后从AI采购研究中汲取教训,同时指出拨款资助面临的独特挑战,这些挑战值得进一步研究。
arXiv:2505.08130v1 宣告类型: cross
摘要:大型语言模型(LLMs)的兴起革命性地改变了信息检索的方式,使用户可以通过对话中的复杂指令获取所需答案。然而,目前公开可用的服务在满足教职工和学生搜索校园特定信息的需求方面仍显不足。主要原因是大型语言模型缺乏专业领域的知识,以及搜索引擎在支持多语言和及时场景方面的局限性。为应对这些挑战,我们引入了ALOHA,这是一种通过分层检索增强的多语言代理,用于大学迎新。我们还将外部API集成到前端界面中,以提供交互式服务。经过人类评估和案例研究显示,我们提出的系统具有强大的能力,能够以多种语言对查询提供正确、及时和用户友好的回答,超越了商业聊天机器人和搜索引擎。该系统已部署并已为超过12,000人提供了服务。
arXiv:2505.08129v1 交叉类型: cross
摘要: 本文提出了一种用于机器学习的新正则化程序。提出的高阶正则化(HR)为正则化提供了新的见解,广泛用于训练神经网络,这些神经网络可以用于近似通用强化学习问题中的动作值函数。提出的HR方法确保了近似算法的可证明收敛性,这在正则化与使用神经网络的解释性学习之间的必要联系中起到了作用。提出的HR方法从理论上证明了正则化可以被视为逆映射的近似,并且可以计算出近似误差,其中$L_2$正则化是提出方法的低阶情况。我们提供了提出的HR解的误差上下界,这有助于构建可靠的模型。我们还发现,使用提出的HR的正则化可以被视为一个收缩。我们证明,在适当正则化矩阵的情况下,神经网络的一般化能力可以最大化,并且提出的HR适用于任何映射矩阵的神经网络。通过理论解释神经网络的极端学习机和提出的高阶正则化,人们可以更好地解释神经网络的输出,从而实现解释性学习。我们基于正则化极端学习神经网络呈现了一个案例研究,以展示提出的HR的应用,并给出了相应的增量HR解决方案。我们通过解决强化学习中的经典控制问题验证了所提出的HR方法的性能,结果证明了该方法在神经网络一般化能力方面的优越性能,显著增强了性能。
arXiv:2505.08124v1 宣传类型: cross
摘要: 语言增强的场景表示在大规模机器人应用如搜索与救援、智慧城市和矿业中展现出巨大的潜力。这些场景中的许多都具有时间敏感性,需要快速进行场景编码,同时也非常数据密集,因此需要可扩展的解决方案。在计算资源有限的机器人上部署这些表示进一步增加了挑战。为了解决这个问题,我们介绍了SLAG,这是一种多GPU框架,它通过高斯点绘制增强了大型场景嵌入的速度和可扩展性。我们的方法使用SAM和CLIP将2D视觉-语言模型特征整合到3D场景中。与之前的方法不同,SLAG消除了计算每个高斯语言嵌入所需的损失函数的需要。相反,它通过标准化加权平均从3D高斯场景参数中推导嵌入,从而实现高效的并行场景编码。此外,我们引入了一个向量数据库以提高嵌入的存储和检索效率。我们的实验结果显示,与OpenGaussian相比,在16-GPU设置下,SLAG在嵌入计算中实现了18倍的加速,同时在ScanNet和LERF数据集上保持了嵌入质量。要了解更多信息,请访问我们的项目网站:https://slag-project.github.io/。
arXiv:2505.08123v1 交叉类别
摘要:多材料分解(MMD)能够对人体组织成分进行定量重建,支持广泛的应用领域。然而,传统MMD通常需要光谱CT扫描仪和预先测量的X射线能量谱,这极大地限制了临床应用。为解决这一问题,人们开发了利用常规CT系统(即单一能量CT系统,SECT)进行MMD的方法,通常称为SEMMMD。尽管取得了令人鼓舞的进展,但大多数SEMMMD方法都遵循两步图像分解流程:首先使用算法如FBP重建单能CT图像,然后在这些图像上进行分解。然而,初始重建步骤并未考虑人体组织的能量依赖性衰减,这在后续的分解过程中引入了严重的非线性束硬化伪影和噪声。本文提出了JSover,这是一种重新构思的一站式SEMMMD框架,能够同时从SECT投影中直接重建多材料组成并估计能量谱。通过在SEMMMD过程中显式地整合物理约束的光谱先验知识,JSover能够从SECT采集数据构建一个虚拟的光谱CT系统,从而提高分解的可靠性和准确性。此外,我们引入了隐式神经表示(INR)作为无监督深度学习求解器,用于表示底层材料图。INR的归纳偏差有利于连续图像模式的表示,这进一步限制了解空间并提高了估计的质量。在模拟和真实CT数据集上的广泛实验表明,在准确性和计算效率方面,JSover优于最先进的SEMMMD方法。
arXiv:2505.08106v1 类型: cross
摘要: 在大型语言模型(LLMs)研究中的一个开放问题在于,它们是否能够模仿人类的道德推理,并作为人类判断的可信代理。为了探讨这一问题,我们引入了一个基准数据集,包含196个真实世界的道德困境和专家意见,每个困境被分割成五个结构化的组成部分:引言、关键因素、历史理论视角、解决方案策略和关键要点。我们还收集了非专家的人类响应进行比较,但由于这些部分的简短性,仅限于关键因素部分。我们使用基于BLEU、Damerau-Levenshtein距离、TF-IDF余弦相似性和通用句子编码相似性的复合度量框架来评估多个最前沿的LLMs(GPT-4o-mini、Claude-3.5-Sonnet、Deepseek-V3、Gemini-1.5-Flash)。度量权重通过基于反向排序校准和成对AHP分析来计算,这使得模型输出与专家响应之间的细粒度比较成为可能。我们的结果显示,LLMs在词汇和结构对齐方面通常优于非专家人类,在所有部分中GPT-4o-mini表现最为稳定。然而,所有模型在历史背景和提出细致的解决方案策略方面都遇到了困难,这需要上下文抽象。尽管非结构化的回应在语义相似度方面偶尔能达到与专家相当的水平,这表明了人类的直观道德推理。这些发现突显了LLMs在道德决策中的优势和当前的局限性。