arXiv 论文列表

作者: Xinyu Su, Feng Liu, Yanchuan Chang, Egemen Tanin, Majid Sarvi, Jianzhong Qi

交通预测是交通系统运行和优化的重要问题。最先进的解决方案通过最小化训练数据的平均预测误差来训练机器学习模型。由于周期性事件在训练数据中经常占主导地位，因此训练后的模型在预测结果中往往偏向于周期性事件而不是非周期性事件。虽然非周期性事件（例如交通事故）提供了关键的优化机会，但现有模型可能会忽略它们。为了解决这个问题，我们提出了DualCast——一个用于增强交通预测模型学习能力的模型框架，尤其针对非周期性事件。DualCast采用双分支架构，将交通信号分解为两种类型：一种反映内在的时空模式，另一种反映包括非周期性事件在内的外部环境上下文。我们进一步提出了一种跨时间注意力机制，以捕捉周期性和非周期性模式的高阶时空关系。DualCast具有通用性。我们将它与最新的交通预测模型集成，在多个真实数据集上始终如一地将预测误差降低多达9.6%。

发布时间: 11/28/2024

查看原文

GAPartManip：一个用于材料无关关节物体操作的大规模部件中心数据集

作者: Wenbo Cui, Chengyang Zhao, Songlin Wei, Jiazhao Zhang, Haoran Geng, Yaran Chen, He Wang

有效操控家居场景中的关节物体是实现通用具身人工智能的关键一步。主流的3D视觉研究主要集中于通过深度感知和姿态检测来进行操控。然而，在真实环境中，这些方法往往由于深度感知不完善（例如透明盖子和反光把手）而面临挑战。此外，它们通常缺乏基于部件交互的多样性，而这对于灵活且适应性强的操控是必需的。为了解决这些挑战，我们引入了一个大规模的以部件为中心的关节物体操控数据集，该数据集具有照片级逼真的材质随机化和详细的部件导向、场景级可操作交互姿态标注。我们通过将数据集与几种最先进的深度估计和交互姿态预测方法相结合来评估其有效性。此外，我们提出了一种新颖的模块化框架，该框架可为通用关节物体操控提供优越且稳健的性能。我们广泛的实验表明，我们的数据集显著提高了模拟和真实场景中深度感知和可操作交互姿态预测的性能。

发布时间: 11/28/2024

查看原文

可穿戴智能喉部设备使中风性构音障碍患者能够自然发声

作者: Chenyu Tang, Shuo Gao, Cong Li, Wentian Yi, Yuxuan Jin, Xiaoxue Zhai, Sixuan Lei, Hongbei Meng, Zibo Zhang, Muzi Xu, Shengbo Wang, Xuhang Chen, Chenxi Wang, Hongyun Yang, Ningli Wang, Wenyu Wang, Jin Cao, Xiaodong Feng, Peter Smielewski, Yu Pan, Wenhui Song, Martin Birchall, Luigi G. Occhipint

可穿戴无声语音系统在恢复言语障碍患者的交流方面具有巨大潜力。然而，流畅、连贯的语音仍然难以实现，其临床疗效尚未得到证实。本文介绍了一种人工智能驱动的智能喉咙 (IT) 系统，该系统将喉肌振动和颈动脉脉搏信号传感器与大型语言模型 (LLM) 处理相结合，以实现流畅、富于情感表达的交流。该系统利用超灵敏的纺织应变传感器从颈部区域采集高质量信号，并支持令牌级处理以进行实时、连续的语音解码，从而实现无缝、无延迟的通信。在对五名患有构音障碍的中风患者进行的测试中，IT 的 LLM 智能体能够有效地纠正令牌错误，并增强句子层面的情感和逻辑连贯性，实现了较低的错误率（字错误率 4.2%，句子错误率 2.9%），用户满意度提高了 55%。这项工作建立了一个便携式、直观的交流平台，供患有构音障碍的患者使用，并有可能广泛应用于不同的神经系统疾病和多语言支持系统。

发布时间: 11/28/2024

查看原文

基于深度学习的纵向无创诊断多模态整合用于免疫治疗生存预测

作者: Melda Yeghaian, Zuhir Bodalal, Daan van den Broek, John B A G Haanen, Regina G H Beets-Tan, Stefano Trebeschi, Marcel A J van Gerven

目的：利用人工智能分析非侵入性纵向多模态数据，有可能改变癌症患者的免疫治疗方法，为精准医疗铺平道路。方法：在本研究中，我们整合了来自694名接受免疫治疗的大型泛癌队列患者的治疗前和治疗期间的血液检测结果、处方药物以及基于CT的器官体积，以预测短期和长期总生存率。通过利用近期发展的多种方法，我们端到端地训练了扩展的多模态基于Transformer的简单时间注意网络 (MMTSimTA) 的不同变体，以预测三个月、六个月、九个月和十二个月的死亡率。这些模型还与包含中间和后期融合的基线方法进行了比较。结果：扩展的基于Transformer的多模态模型展现出最强的预后性能，其曲线下面积 (AUC) 分别为 3 个月、6 个月、9 个月和 12 个月的生存预测为 0.84 ± 0.04、0.83 ± 0.02、0.82 ± 0.02 和 0.81 ± 0.03。结论：我们的研究结果表明，分析整合的早期治疗数据具有预测免疫治疗患者生存率的潜力。将互补的非侵入性模态整合到联合训练的模型中，使用我们扩展的基于Transformer的架构，展现出改进的多模态预后性能，尤其是在短期生存预测方面。

发布时间: 11/28/2024

查看原文

IKUN：利用代理稳定方差保持SNN训练和泛化性能的初始化方法

作者: Da Chang, Deliang Wang, Xiao Yang

权重初始化对神经网络的收敛和性能影响显著。虽然Xavier和Kaiming初始化等传统方法被广泛使用，但它们往往难以满足脉冲神经网络（SNN）的需求，因为脉冲神经网络与人工神经网络（ANN）相比具有不同的要求。为了解决这个问题，我们引入了**IKUN**，这是一种与替代梯度函数集成的方差稳定初始化方法，专门为SNN设计。**IKUN** 稳定了信号传播，加速了收敛，并增强了泛化能力。实验表明，**IKUN** 将训练效率提高了高达**50%**，实现了**95%** 的训练精度和**91%** 的泛化精度。Hessian分析表明，**IKUN**训练的模型收敛到更平坦的极小值，其特征是Hessian特征值在正侧接近于零，从而促进了更好的泛化能力。该方法已开源，以便进一步探索：\href{https://github.com/MaeChd/SurrogateVarStabe}{https://github.com/MaeChd/SurrogateVarStabe}。

发布时间: 11/28/2024

查看原文

THaLLE 在泰国金融领域的适应性研究——技术报告

作者: KBTG Labs, Atthakorn Petchsod, Pornchanan Balee, Danupat Khamnuansin, Anuruth Lertpiya, Chanatip Saetia, Tawunrat Chalothorn, Thadpong Pongthawornkamol, Monchai Lertsutthiwong

大型语言模型 (LLM) 在通用任务中表现出色，但在特定领域面临挑战，例如专业术语和本地法规。现有的金融 LLM，如 FinGPT 和 BloombergGPT，缺乏对泰国金融领域的支持。我们利用泰国证券交易所的投资顾问 (IC) 考试数据集开发了一个泰国金融 LLM。为了解决数据集的局限性，我们应用了数据增强、高效训练的 ReLoRA、领域知识的持续预训练 (CPT) 以及用于微调的秩稳定 LoRA (rsLoRA)。监督微调 (SFT) 模拟了考试场景，而直接偏好优化 (DPO) 使用反馈对模型进行了改进。该模型在 IC 考试 P1、P2 和 P3 级别的得分分别为 72%、72% 和 84%，证明了其在泰国金融咨询任务中的有效性及其在专业应用中的潜力。

发布时间: 11/28/2024

查看原文

基于LangGraph+CrewAI的大型语言模型多智能体应用探索

作者: Zhihua Duan, Jialin Wang

随着大型模型技术的快速发展，智能体技术在各个领域的应用日益广泛，深刻地改变着人们的工作和生活方式。在复杂动态的系统中，多智能体通过分工协作完成单个智能体难以完成的复杂任务。本文探讨了LangGraph和CrewAI的集成应用。LangGraph通过图架构提高信息传输效率，而CrewAI通过智能的任务分配和资源管理增强团队协作能力和系统性能。本文的主要研究内容包括：（1）基于LangGraph设计精确控制的智能体架构；（2）基于CrewAI增强智能体完成多种任务的能力。本研究旨在深入探讨LangGraph和CrewAI在多智能体系统中的应用，为智能体技术的未来发展提供新的视角，推动大型模型智能体领域的技术进步和应用创新。

发布时间: 11/28/2024

查看原文

基于分支定界法的可认证训练：李雅普诺夫稳定神经控制的案例研究

作者: Zhouxing Shi, Cho-Jui Hsieh, Huan Zhang

我们研究了学习李雅普诺夫稳定神经控制器的难题，该控制器可在吸引区域内经验证满足李雅普诺夫渐近稳定性条件。与以往通常使用反例引导训练的方法不同，我们开发了一个新的、普遍公式化的认证训练框架 CT-BaB，并针对可微分的验证界限进行优化，以生成易于验证的模型。为了处理相对较大的感兴趣区域，我们提出了一种新颖的训练时分支定界框架，以在整个训练过程中动态维护子区域的训练数据集，以便迭代地将最难的子区域细分为更小的子区域，从而可以更紧密地计算其验证界限，从而简化训练。我们证明了我们的新训练框架可以生成在测试时可以更有效验证的模型。在最大的二维四旋翼动力学系统上，与基线相比，我们模型的验证速度提高了 5 倍以上，而我们的吸引区域大小是基线的 16 倍。

发布时间: 11/28/2024

查看原文

基于随机网格搜索的决策树模型超参数调优以提高心血管疾病分类性能

作者: Abhay Kumar Pathak, Mrityunjay Chaubey, Manjari Gupta

心血管疾病是指任何危及心脏的严重疾病。由于心脏病可能危及生命，研究人员正致力于利用机器学习算法，基于电子健康数据设计智能系统以准确诊断心脏病。然而，使用支持向量机 (SVM)、朴素贝叶斯 (NB)、决策树 (DT) 和随机森林 (RF) 等机器学习 (ML) 算法进行心脏病分类常常受到过拟合的困扰。这些机器学习算法需要大量的超参数调整。随机搜索提供了一种更快、更高效的超参数空间探索方法，但它可能会忽略最佳区域。网格搜索虽然详尽，但计算成本高且效率低，尤其是在高维数据的情况下。为了解决这些局限性，本文提出了一种新颖的混合优化方法——随机网格搜索，它结合了随机搜索的全局探索优势以及在最有希望的区域进行的网格搜索的集中和详尽搜索。这种混合方法有效地平衡了探索和利用。该模型优化了决策树模型的超参数，并将其应用于 UCI 心脏病数据集进行分类，从而提高了模型性能，并改善了准确性、泛化能力和计算效率。实验结果表明，随机网格搜索比传统方法具有显著优势。该模型为医疗诊断中的机器学习应用提供了一种更有效的解决方案。

发布时间: 11/28/2024

查看原文

特征工厂：使用生成式AI自动集成软件功能

作者: Ruslan Idelfonso Magana Vsevolodovna

将新功能集成到现有软件项目中可能是一个复杂且耗时的过程。Feature-Factory利用生成式AI和WatsonX.ai来自动化功能请求的分析、规划和实现。通过结合高级项目解析、依赖项解析和AI生成的代码，该程序确保功能与软件系统的无缝集成，同时保持结构完整性。本文介绍了Feature-Factory框架的方法论、数学模型和结果。

发布时间: 11/28/2024

查看原文