arXiv:2501.18441v1 分类: 综合
摘要:本文探讨了社交媒体算法和过滤泡沫如何导致在线话语的碎片化,从而加剧意识形态分歧并削弱共享理解。本文借鉴迈克尔·桑德尔强调的社区和共享价值观的哲学观点,研究了在社会紧张局势加剧期间,数字平台如何放大包括性别歧视、种族主义、仇外心理、 ableism(对残疾人的歧视)、恐同症和宗教宽容度差在内的歧视话语。通过对数字社区动态的分析,研究突显出话语碎片在面对现实世界事件时出现和演变的机制。研究结果揭示了社交媒体结构如何加剧 polarization(极化),限制跨群体对话,并侵蚀对于一个公正社会必不可少的集体推理能力。本文将哲学视角置于对社交媒体互动的计算分析中,提供了一个关于数字时代碎片化话语所带来的挑战的细致理解。
arXiv:2411.10406v2 量子计算类型:横跨领域
摘要:在四十年的时间里,量子计算从一种智力上的好奇心发展成为一种潜在可实现的技术。如今,在数百个物理量子位上进行量子算法原语的小规模演示已经成为可能,并且在单一逻辑量子位上进行了原则性纠错演示。然而,尽管取得了显著的进步和兴奋,通往全栈可扩展技术的道路仍然很大程度上未知。尚存的重大量子硬件、制造、软件架构和算法挑战要么未得到解决,要么未被忽视。这些问题可能会严重阻碍未来可实用性量子计算机的到来。在此,我们提供了一篇全面的综述,概述了这些扩展挑战。我们展示了通过采用现有的半导体技术来构建更高质量的量子位、采用系统工程方法以及在异构高性能计算基础设施内进行分布式量子计算,道路何以可以铺平以实现扩展。这些研究和发展机会能够解锁某些有前景的应用,特别是高效地模拟或学习由自然或设计的量子系统生成的量子数据。为了估算这些承诺的真正成本,我们根据基于超导量子位的当前、目标和所需硬件规格,提供了对于表面码纠错量子计算机上经典难解的量子化学计算所必需的资源和敏感性分析,这些计算考虑了现实的错误分布。此外,我们认为,为了以成本效益的方式解决工业规模的经典优化和机器学习问题,采用定制设计的加速器进行异构量子-概率计算应当被视为一条补充的道路以实现扩展。
arXiv:2410.14170v2 Announce Type: cross
摘要:个性化内容过滤,如推荐系统,已成为缓解信息过载的一项关键基础设施。然而,这些系统仅仅筛选现有内容,并受限于其有限的多样性,这使得很难满足用户的多样化内容需求。为了解决这一局限性,个性化内容生成作为一种前景广阔的方向已经出现。尽管如此,现有的大多数研究集中在个性化文本生成上,而对个性化图像生成的关注相对较少。现有的个性化图像生成工作在从嘈杂的用户交互图像和复杂的多模态指令中准确捕捉用户视觉偏好和需求方面面临挑战。更糟糕的是,缺乏用于训练个性化图像生成模型的监督数据。
为克服这些挑战,我们提出了一种名为Pigeon的个性化图像生成框架,该框架采用优秀的大型多模态模型,并包含三个专门模块来从嘈杂的用户历史和多模态指令中捕捉用户的视觉偏好和需求。为了缓解数据稀疏性问题,我们引入了一种两阶段的偏好对齐方案,包括掩码偏好重构和成对偏好对齐,以将Pigeon和个性化图像生成任务对齐。我们在个性化贴纸和电影海报生成中应用了Pigeon,并且大量定量结果和人类评估表明,其在各种生成基线中具有优越性。
arXiv:2502.02549v1 公告类型: 新
摘要: 部分可观测马尔可夫决策过程(POMDPs)提供了一种在自主驾驶和机器人探索等应用中在不确定性下进行决策的稳健框架。其扩展 $\rho$POMDPs 引入了信念相关的奖励,允许进行显式不确定性推理。现有的针对连续空间的在线 $\rho$POMDP 求解器依赖于固定信念表示,限制了适应性和细化——这对信息收集等任务至关重要。我们提出了 $\rho$POMCPOW,这是一种任何时间的求解器,能够动态细化信念表示,并具有随时间改进的正式保证。为了减轻更新信念相关奖励的高计算成本,我们提出了一种新的增量计算方法。我们展示了其在常见熵估计器上的有效性,将计算成本大幅降低。实验结果显示,$\rho$POMCPOW 在效率和解的质量上均优于现有最先进的求解器。
arXiv:2502.02446v1 通知类型: 新
摘要: 最近,消息传递图神经网络(MPNNs)因能够捕捉变量-约束交互作用而在组合优化和连续优化问题中显示出潜力。虽然现有的方法利用MPNNs来近似解决方案或作为传统求解器的预热,它们在凸优化设置中往往缺乏可行性保证。在这里,我们提出了一个具有可证明的可行性保证的迭代MPNN框架来解决凸优化问题。首先,我们证明MPNNs可以可证明地模拟解决具有线性约束的二次问题的标准内部点方法,涵盖如支持向量机(SVMs)的相关问题。其次,为了确保可行性,我们引入了一种变体,该变体从可行点开始,并且迭代地限制在可行区域内进行搜索。实验结果表明,我们的方法在解决方案质量与可行性的表现上优于现有的神经基线方法,在一些情况下即使面对之前未见过的问题规模,也能很好地泛化,并且在某些情况下,求解速度超过了最先进的求解器Gurobi。
arXiv:2502.02377v1 宣告类型: 新
摘要: 我们提出了一种最小最大-Bayes 方法来优化Ad Hoc 团队合作(AHT),以在合作伙伴的对抗先验下优化政策,并明确考虑部署时对合作伙伴的不确定性。与现有方法假设特定的合作伙伴分布不同,我们的方法可以改善最坏情况下的性能保证。广泛的实验,包括对Melting Pot 套件中的协调烹饪任务的评估,显示了我们的方法在鲁棒性上优于自我对弈、假想博弈和最佳反应学习。我们的工作强调了在AHT 中选择合适的队友训练分布以实现鲁棒性的重要性。
arXiv:2502.02180v1 属性类型: 新的
摘要:能力评估对于理解和调节可能被部署或进一步开发的人工智能系统是必要的。因此,评估应该提供对人工智能系统能力准确估计的重要性是显而易见的。然而,在许多情况下,先前未显现的能力在模型被释放后很长时间才被激发出来。因此,已经投入了大量努力来开发从模型中激发潜在能力的方法。在本文中,我们通过故意训练模型生物(具有隐藏能力的语言模型,这些能力通过密码揭示)来评估能力激发技术的有效性。我们介绍了一种基于电路断开的新方法来训练模型生物,该方法对于激发技术比标准的密码锁定模型更为稳健。我们集中在基于提示和激活导向的激发技术上,并将其与微调方法进行了比较。在MCQA设置中,提示技术可以激发密码锁定和电路断开模型生物的真实能力,而激活导向则无法实现这一目标。对于代码生成任务,只有微调才能激发我们新型模型生物的隐藏能力。此外,我们的结果显示,结合技术可以提高激发的有效性。然而,如果可行,微调应是提高能力评估可信度的最佳方法。
arXiv:2502.02153v1 安全对齐类型: 新颖
摘要:安全对齐是现实世界AI应用中的一个关键研究主题。尽管AI中的安全性和可靠性具有多维性,但当前的安全对齐方法往往关注全面的安全概念。通过对现有安全对齐方法的模型进行仔细评估,我们发现,虽然它们通常提高了整体的安全性能,但在特定类别中未能确保安全。我们的研究首先确定了在不牺牲模型的帮助性的情况下消除这些漏洞的难度。我们观察到,尽管较小的KL惩罚参数、增加的训练迭代次数和数据集清洗可以增强安全性,但它们并不一定能够改善安全性和帮助性的权衡。我们发现,安全对齐甚至可能会引起意想不到的效果,导致模型倾向于生成负面标记,从而产生拒绝性回应,无论输入的上下文如何。为了解决这一问题,我们引入了一种无需学习的方法——标记级安全去偏见推理(TSDI),该方法在生成过程中使用随机构造的提示来估算和纠正这种偏差。我们的实验表明,我们的方法可以增强模型的帮助性同时保持安全性,从而改进Pareto前沿。
arXiv:2502.02145v1 宣布类型: 新论文
摘要: 大型语言模型(LLMs)能够捕捉到细微的上下文关系、推理和复杂的解决问题的能力。通过利用其处理和解释大规模信息的能力,LLMs 已经显示出解决特定领域挑战的潜力,包括自动驾驶系统中的挑战。本文提出了一种新的框架,利用LLMs进行生成的驾驶场景的风险感知分析。我们假设LLMs能够有效地评估由自动驾驶测试模拟器生成的驾驶场景是否是安全关键的。为了验证这一假设,我们进行了一项实证评估以评估LLMs执行此任务的有效性。该框架还将通过使用对抗方法修改现有的非关键场景以生成新的安全关键场景,并测试其在验证运动规划算法的有效性方面的作用。相关代码和场景可在以下链接获得:https://github.com/yuangao-tum/Riskaware-Scenario-analyse
arXiv:2502.02135v1 宣告类型: 新
摘要:目前设计的神经网络未能实现真正的逻辑智能。现代人工智能模型依赖于基于标准神经计算和内积的非线性激活的图案近似方法。虽然这些方法在归纳学习中是有效的,但这种架构缺乏进行演绎推理和逻辑一致性的结构性保证。因此,在没有大量事后修改的情况下,深层网络在基于规则的推理、结构化泛化和可解释性方面遇到困难。这篇立场论文认为,必须从根本上重新思考标准神经层以整合逻辑推理。我们提倡使用逻辑神经单元(LNUs)——模块化的组件,直接在神经架构中嵌入可微近似逻辑运算(例如,AND、OR、NOT)。我们批评现有的神经符号方法,指出标准神经计算在进行逻辑推理方面的局限性,并将LNUs视为人工智能领域必要的范式转变。最后,我们概述了实施路线图,讨论了理论基础、架构集成和未来研究的关键挑战。