LLM2D

arXiv 论文列表

arXiv:2504.18875v1 宣告类型: 新 摘要:代理型人工智能(AI)基于生成型人工智能(GenAI)构建。它构成了人工智能进化中的重大步骤,具有更强的推理和交互能力,能够实现更自主的行为以应对复杂任务。自ChatGPT(3.5)最初发布以来,生成型人工智能已得到广泛应用,让用户亲身体验。然而,代理型人工智能与生成型人工智能之间的区别仍然不太清楚。为了弥补这一差距,我们的调查分为两部分。在第一部分中,我们使用现有文献比较了生成型人工智能和代理型人工智能,讨论了它们的关键特征,代理型人工智能如何弥补生成型人工智能的局限性,以及生成型人工智能向代理型人工智能演变的主要步骤。本部分旨在为广泛的受众提供资料,包括社会科学和工程领域的学者以及行业专业人士,提供理解代理型人工智能所带来新型应用所需的认识。在第二部分中,我们深入探讨了代理型人工智能的新型方面,包括最近的发展和实际关注点,如定义代理。最后,我们讨论了几项可能成为未来研究议程的挑战,同时提醒在超过人类智能时可能出现的风险。
发布时间: 4/29/2025
查看原文
arXiv:2504.18794v1 公告类型: 新增 摘要: 分层强化学习(HRL)假设能够在稀疏奖励方案下利用机器人学习任务中存在的固有层次结构,与传统的强化学习算法不同。在本研究中,分层强化学习被评估并与标准强化学习在复杂导航任务中进行对比。我们评估了分层强化学习的独有特性,包括其创建子目标的能力和终止函数。我们构建了实验以测试PPO与HRL之间的差异、不同的子目标创建方法、手动与自动子目标创建以及终止频率对性能的影响。这些实验突显了分层强化学习的优势及其如何实现这些优势。
发布时间: 4/29/2025
查看原文
arXiv:2504.18777v1 宣布类型: 新增 摘要: 地图数字化是将地图转换为可用于进一步分析的数字格式的重要过程。这个过程通常需要大量的人工参与,因为当需要将复杂的特征进行翻译时,需要进行解释和决策。随着人工智能的进步,借助机器学习技术进行地图数字化成为了一种新的选择。Deepness,或深神经遥感,是一种高级的人工智能驱动工具,在QGIS应用程序中作为附加插件进行设计和整合。本研究侧重于评估Deepness在自动化数字化方面的有效性。这项研究分析了从Google Earth图像生成的数字化结果,并将其与OpenStreetMap (OSM) 的数字化输出进行比较,以评估其性能。
发布时间: 4/29/2025
查看原文
作者: Chengwei Liu, Chong Wang, Jiayue Cao, Jingquan Ge, Kun Wang, Lvye Zhang, Ming-Ming Cheng, Penghai Zhao, Tianlin Li, Xiaojun Jia, Xiang Li, Xinfeng Li, Yang Liu, Yebo Feng, Yihao Huang, Yijia Xu, Yuqiang Sun, Zhenhong Zhou, Zhengzi Xu
arXiv:2504.18765v1 Announce Type: 新 摘要:本文介绍了基于代理的自动研究,这是一种结构化的多代理框架,旨在自动化、协调和优化科学研究的整个生命周期。利用大型语言模型(LLMs)和模块化代理协作的能力,该系统涵盖了所有主要的研究阶段,包括文献回顾、构想、方法规划、实验、论文撰写、同行评审回复以及传播。通过解决流程碎片化、方法论专业知识不均以及认知负担过重等问题,该框架提供了科学研究的一种系统性和可扩展的方法。初步探索显示,自动研究作为一种有望提高自我改进能力的、由AI驱动的研究过程范式具有可行性和潜力。
发布时间: 4/29/2025
查看原文
作者: Samuel Schapiro, Jonah Black, Lav R. Varshney
arXiv:2504.18687v1 宣告类型: 新 摘要: 创造过程通常分为三种类型:组合式、探索式和转化式。在这里,我们提供了一种图形理论,用于转化性科学创造,综合了波登的观点,即转化性创造源于概念空间的“使能约束”的变化,以及库恩关于科学革命结构的观点,认为其源于范式的转变。我们证明了对我们的图形模型公理所做的修改具有最大的转化潜力,然后证明了我们的框架可以捕获几个历史上转化性创造的实例。
发布时间: 4/29/2025
查看原文
作者: Ross Gore, Eranga Bandara, Sachin Shetty, Alberto E. Musto, Pratip Rana, Ambrosio Valencia-Romero, Christopher Rhea, Lobat Tayebi, Heather Richter, Atmaram Yarlagadda, Donna Edmonds, Steven Wallace, Donna Broshek
arXiv:2504.18671v1 诊断类型: 新颖 摘要: 轻微创伤性脑损伤(TBI)检测由于医学影像中症状的细微且经常模糊的表现形式而充满挑战,使得准确诊断成为一个复杂的问题。为了解决这些挑战,我们提出了Proof-of-TBI,一个结合了多个微调过的视觉-语言模型和OpenAI-o3推理大语言模型(LLM)的医疗诊断支持系统。我们的方法使用带有TBI MRI扫描标签的数据集微调多个视觉-语言模型,使其能够有效诊断TBI症状。这些模型的预测通过基于共识的决策过程进行汇总。系统使用OpenAI-o3推理LLM评估所有微调过的视觉-语言模型的预测,这是一个已经表现出卓越推理性能的模型,以生成最准确的最终诊断。LLM代理协调视觉-语言模型与推理LLM之间的互动,以透明、可靠和自动化的形式管理最终的决策过程。整个决策流程结合了视觉-语言模型联盟与OpenAI-o3推理LLM,通过LLM代理的自定义提示工程实现。该平台的原型是在与弗吉尼亚州纽波特新闻的美国陆军医学研究团队合作开发的,集成了五个微调过的视觉-语言模型。结果展示了将微调过的视觉-语言模型输入与OpenAI-o3推理LLM结合以创建一个强大的、安全的和高度准确的轻度TBI预测诊断系统的潜力。据我们所知,这项研究代表了首次将微调过的视觉-语言模型与推理LLM结合应用于TBI预测任务的应用。
发布时间: 4/29/2025
查看原文
作者: Filipi Miranda Soares, Antonio Mauro Saraiva, Lu\'is Ferreira Pires, Luiz Olavo Bonino da Silva Santos, Dilvan de Abreu Moreira, Fernando Elias Corr\^ea, Kelly Rosa Braghetto, Debora Pignatari Drucker, Alexandre Cl\'audio Botazzo Delbem
arXiv:2504.18651v1 通知类型: 新 摘要: 管理表示物种分类的本体中的科学名称具有挑战性,因为这些分类学不断演变。当处理成千上万的科学名称时,手动维护这些名称变得越来越困难。为了应对这一问题,本文研究了使用ChatGPT-4来自动化农业产品类型本体(APTO)中“Organism”模块的开发,以进行物种分类。我们的方法包括利用ChatGPT-4从GBIF Backbone API提取数据并生成OWL文件,以便在APTO中进一步集成。探索了两种替代方法:(1)一系列提示,通过BrowserOP插件使ChatGPT-4执行任务,(2)指示ChatGPT-4设计Python算法以执行类似任务。这两种方法都依赖于提示方法,我们提供指令、上下文、输入数据和输出指示。第一种方法展示了可扩展性的限制,而第二种方法使用Python算法克服了这些挑战,但在数据处理时遇到了一些拼写错误。本研究突显了大型语言模型如ChatGPT-4在简化本体中物种名称管理方面的潜力。尽管存在某些限制,这些工具在自动化分类学相关任务以及提高本体开发效率方面提供了有前景的进展。
发布时间: 4/29/2025
查看原文
arXiv:2504.18631v1 宣布类型: 新 摘要: 随着根据高维度异质时间序列信息及时制定个性化干预计划成为当前医疗领域的一项重要挑战,电子医疗记录、可穿戴设备以及其他多源医疗数据正在不断增加并多样化。在本文中,我们开发了一个基于组相对策略优化(GRPO)和时间序列数据融合生成个性化医疗干预策略的系统。首先,在策略梯度更新过程中引入组间的相对策略约束,我们能够自适应地平衡个体和群体的利益。为了提高决策的鲁棒性和可解释性,我们采用多层神经网络结构对患者特征进行组编码。其次,为了实现多模态的快速多源异质时间序列融合,我们使用结合自注意力机制的多通道神经网络进行动态特征提取。通过差分门控网络实现关键特征的选择和聚合。最后,提出了一种结合遗传算法和蒙特卡洛树搜索的协作搜索过程来寻找理想的干预策略,实现了全局优化。实验结果表明,与现有方法相比,该方法在准确性、覆盖率和决策效益方面取得了显著改进。
发布时间: 4/29/2025
查看原文
作者: Xingyu Xiao, Peng Chen, Jiejuan Tong, Shunshun Liu, Hongru Zhao, Jun Zhao, Qianqian Jia, Jingang Liang, Haitao Wang
arXiv:2504.18604v1 通知类型: 新 摘要: 传统的人员可靠性分析(HRA)方法,如IDHEAS-ECA,依赖于专家判断和经验规则,这些规则往往忽视了人类错误的认知基础。此外,由于新型接口和有限的操作数据,为先进的核电厂进行人员在环实验变得越来越不切实际。本研究提议了一种认知机理框架(COGMIF),通过结合基于ACT-R的人数字孪生(HDT)和TimeGAN增强的仿真来增强IDHEAS-ECA方法。ACT-R模型在来自高温气冷堆(HTGR)模拟器的高保真场景下模拟操作员的认知,包括记忆检索、目标导向的程序推理和知觉-运动执行。为克服大规模认知建模的资源限制,TimeGAN被训练以ACT-R生成的时间序列数据为基础,以产生高保真的合成操作员行为数据集。然后使用这些仿真驱动IDHEAS-ECA评估,以实现规模化的、基于机理的人为错误概率(HEPs)估计。与SPAR-H的对比分析和敏感性评估展示了提议的COGMIF的稳健性和实际优势。最后,过程特征被映射到贝叶斯网络中,以量化影响因素的数量关系,揭示了操作风险的关键驱动因素。这项工作提供了一条将认知理论纳入工业HRA实践的可信且计算效率高的途径。
发布时间: 4/29/2025
查看原文
作者: Saizhuo Wang, Hao Kong, Jiadong Guo, Fengrui Hua, Yiyan Qi, Wanyun Zhou, Jiahao Zheng, Xinyu Wang, Lionel M. Ni, Jian Guo
arXiv:2504.18600v1 宣告类型: 新 摘要: 人工智能(AI)在量化投资领域的进步显著,但缺乏与行业实践标准对齐的基准。这一缺口阻碍了研究的进步,并限制了学术创新的实际应用。我们介绍了一个工业级基准平台——QuantBench,旨在解决这一关键需求。QuantBench具有三大优势:(1)与量化投资行业实践对齐的标准,(2)能够集成各种AI算法的灵活性,以及(3)涵盖了整个量化投资过程的全流程覆盖。使用QuantBench进行的实证研究表明了一些关键的研究方向,包括持续学习以应对分布变化的需求、改进对相关金融数据建模的方法,以及在低信噪比环境中更稳健的过拟合缓解方法。通过提供一个评估的共同平台,并促进研究人员和实践者之间的合作,QuantBench旨在加速量化投资领域AI的发展,类似于计算机视觉和自然语言处理领域基准平台的影响。
发布时间: 4/29/2025
查看原文