LLM2D

摘要

arXiv:2406.06620v3 通知类型: 替换交叉摘要：近期语言模型（LMs）在医疗时间序列-文本多模态学习方面取得了快速进展，引起了广泛关注。然而，现有的基于对比学习和提示驱动的LM方法往往存在偏差，倾向于赋予时间序列模态主要角色，而将文本模态视为次要角色。我们将这些方法归类为基于时间优先的范式，这可能会忽视文本模态（如临床报告）中嵌入的独特且关键的任务相关信息，从而未能充分利用不同模态之间的互补性和互惠性。为了弥补这一缺口，我们提出了一种新的文本-时间多模态学习范式，使得任一模态都可以作为主要角色，并从中受益，从而有效捕捉模态特定的信息，并促进跨模态交互。具体而言，我们设计了MedualTime，这是一种由双适配器组成的语言模型，能够同时实现时间优先和文本优先建模。在每个适配器中，轻量级的适应标记被注入到LM的顶层，以促进高级模态融合。双适配器共享的LM流水线不仅实现了适配器对齐，还使高效微调成为可能，从而减少了计算资源的消耗。实验证明，MedualTime在医疗数据上表现出了卓越的性能，在监督设置中分别实现了8%的准确率提升和12%的F1分数提升。此外，通过从粗粒度到细粒度医疗数据的少量标记转移实验，验证了MedualTime的迁移性。https://github.com/start2020/MedualTime