arXiv:2504.00029v1 类型: cross
摘要: 在本文中,我们解决了一般操作程序(SOP)管理面临的挑战,这些问题通常在语言、格式和执行方面存在不一致,导致操作效率低下。传统的过程建模需要大量的手工努力、领域专业知识以及对复杂的语言(如业务流程建模符号[BPMN])的熟悉,这为非技术人员设定了障碍。我们提出了一种名为SOP结构(SOPStruct)的新方法,该方法利用大型语言模型(LLMs)将SOPs转换为决策树结构表示。SOPStruct能够提供跨不同领域的标准化SOP表示,减少认知负担,通过有效捕捉任务依赖性和确保顺序完整性提高用户理解。我们的方法使利用结构化信息来自动执行工作流以及赋能人类用户成为可能。通过将程序组织成逻辑图,SOPStruct简化了回溯和错误纠正,提供了一种可扩展的流程优化解决方案。我们采用了一种新的评估框架,结合确定性和Planning Domain Definition Language(PDDL)来验证图的准确性,并通过LLM进行非确定性评估以确保完整性。我们在来自不同领域的不同复杂程度的SOPs上实证验证了基于LLM的结构化SOP表示方法的稳健性。尽管许多组织当前的自动化准备程度不足,但我们的研究强调了LLMs在简化流程建模方面的变革潜力,为未来的工作流程自动化优化铺平了道路。
arXiv:2504.00027v1 交叉公告类型:cross
摘要:药物过量危机仍然是美国公共卫生的重大危机,导致了显著的死亡和社会成本。社交媒体平台如Reddit提供了大量未结构化数据,揭示了公众对阿片类药物使用的态度、讨论和体验。本研究利用自然语言处理(NLP),特别是Opioid Named Entity Recognition(ONER-2025),从这些平台中提取可操作的信息。我们的研究做出了四项关键贡献。首先,我们创建了一个独特的人工标注数据集,该数据集源自Reddit,用户在此分享了通过不同给药途径的自我报告的阿片类药物使用经验。该数据集包含331,285个词汇单元,并包括八个主要的阿片类实体类别。其次,我们详细描述了我们的标注过程和准则,并讨论了对ONER-2025数据集进行标记的挑战。第三,我们分析了阿片类药物讨论中的关键语言挑战,包括俚语、歧义、片段化的句子和情感化的语言。第四,我们提出了一种实时监控系统,该系统处理来自社交媒体、医疗记录和应急服务的流式数据,以识别过量用药事件。通过在11次实验中使用5折交叉验证,我们的系统将机器学习、深度学习和基于变换器的语言模型与先进的上下文嵌入相结合,以提高理解能力。我们的基于变换器的模型(bert-base-NER和roberta-base)达到了97%的准确率和F1分数,比基线高出10.23%(RF=0.88)。
arXiv:2504.00026v1 类型: cross
摘要:本研究探讨了在皮肤和口腔病变医学图像分类(DiffMIC)中使用扩散模型的应用。利用PAD-UFES-20数据集用于皮肤癌和P-NDB-UFES数据集用于口腔癌,扩散模型在性能上与卷积神经网络(CNNs)和变压器等最先进的深度学习模型相当。具体来说,对于PAD-UFES-20数据集,六类分类的平衡准确率为0.6457,二类分类(癌症 vs. 非癌症)的平衡准确率为0.8357。对于P-NDB-UFES数据集,其平衡准确率为0.9050。这些结果表明,扩散模型是可用于分类皮肤和口腔病变医学图像的有效模型。此外,我们还研究了在PAD-UFES-20数据集上训练的模型在HIBA数据集的临床图像上的稳健性。
arXiv:2504.00024v1 类型: cross
摘要:随着高通量基因分型和测序技术的发展,现在可以全面评估大量遗传预测因子在疾病预测中的作用。因此,开发适当统计测量方法以评估这些遗传变异体在疾病预测中的联合效应变得至关重要。预测曲线通常用作衡量风险预测模型对单一连续生物标志物预测能力的图形工具。然而,对于大多数复杂的疾病,风险预测模型是基于多种遗传变异体构建的。因此,我们提出了一种多标记预测曲线,并提供了一种非参数方法来为病例对照研究构建该曲线。我们进一步引入了全局预测性U和部分预测性U,分别用于总结整个人群和临床兴趣亚人群中的预测曲线。我们还展示了预测曲线与ROC曲线和洛伦兹曲线之间的联系。通过模拟,我们将预测性U的性能与其他三个总结指标:决定系数、总增益和平均熵进行了比较,并证明在无偏性和稳健性方面,预测性U优于其他三个指标。此外,我们模拟了一系列罕见变异体疾病模型,发现部分预测性U在性能上优于全局预测性U。最后,我们进行了一项真实数据分析,使用预测曲线和预测性U评估尼古丁依赖的风险预测模型。
arXiv:2504.00020v1 类型: cross
摘要:近期单细胞技术的突破为解读复杂生物系统(尤其是与人类特有疾病相关的系统)的分子复杂性带来了前所未有的机会。然而,这些进展也带来了新的挑战——特别是对与疾病条件相关的大量长尾单细胞数据进行有效的注释。为有效应对这一挑战,我们提出了Celler,一个专为单细胞数据注释设计的先进生成预训练模型。Celler包含了两项创新性的元素:首先,我们引入了Gaussian Inflation(GInf)损失函数。通过动态调整样本权重,GInf损失函数显著提高了模型从稀有类别中学习的能力,同时降低了常见类别过拟合的风险。其次,我们引入了一种创新的Hard Data Mining(HDM)策略,专门针对难以学习的少数数据样本,在训练过程中极大地提高了模型的预测准确性。此外,为了进一步推动这一领域的研究,我们还构建了一个大规模的单细胞数据集——Celler-75,该数据集包含了分布在80个人体组织和75种特定疾病中的4亿个细胞。这个数据集为全面探索单细胞技术在疾病研究中的潜力提供了重要支持。我们的代码可在https://github.com/AI4science-ym/HiCeller获得。
arXiv:2504.00019v1 宣告类型: cross
摘要: 语言模型(LMs)已经成为代码编写工具箱中的必备工具。然而,它们的预训练配方在近年来几乎没有变化,除了偶尔的数据来源和筛选策略的变化。特别是针对代码-LMs预训练目标的研究,旨在提高数据效率并更好地区分语法和语义方面的变化,相关研究明显较少,尤其是在自然语言LMs方面做出了相应的努力。在这项工作中,我们研究了对混淆代码的 grounding 作为一种手段,帮助代码-LMs超越表面形式的语法,并增强其预训练样本效率。为此,我们编译了 ObscuraX 数据集,其中包括七种语言的大约 5500 万对源代码和混淆代码。随后,我们基于包含 ObscuraX 的 272 亿个标记的语料库,预训练了参数范围从 2.55 亿到 28 亿的 ObscuraCoder 模型,并证明了我们基于混淆的预训练配方与传统的 Vanilla 自回归预训练以及现有的去混淆(DOBF)目标相比,能够在代码-LMs 的能力上提供一致的改进。ObscuraCoder 在多个语法和语义代码理解测试中表现出显著的改进,并且在多语言代码补全、多语言代码提交总结以及多用途库导向的代码生成方面也展示了增强的能力。
arXiv:2504.00017v1 交叉类型
摘要:基于视觉的触觉传感器使用结构光来测量其弹性界面的变形。到目前为止,基于视觉的触觉传感器,如 DIGIT 和 GelSight,一直在使用一个针对特定传感器尺寸的静态结构光模式。在本工作中,我们研究了动态照明模式与图像融合技术结合的有效性,以提高基于视觉的触觉传感器的传感质量。具体而言,我们提出捕获多个具有不同照明模式的测量,并将它们融合在一起以获得一个更高质量的单一测量。实验结果表明,这种动态照明方式在提高图像对比度、清晰度和背景差异方面取得了显著的进步。这一发现为现有的基于视觉的触觉传感器提供了一种通过简单的软件更新来提升传感质量的可能性,并为能够充分利用动态照明的新硬件设计打开了可能性。
arXiv:2504.00009v1 交叉类型: cross
摘要: 通过使用预测机器学习(ML)算法,1型糖尿病(T1D)的管理可以显著增强,这可以减轻低血糖等不良事件的风险。低血糖,表现为血糖水平低于70 mg/dL,是一种通常由胰岛素过量注射、漏餐或过度活动引起的危及生命的情况。由于其无症状性,它阻碍了及时干预,因此使得ML模型对于早期检测至关重要。本研究在单一分类模型中整合了短期(最多2小时)和长期(最多24小时)的预测时间窗(PHs),以增强决策支持。预测的时间点分别为低血糖前5-15分钟、15-30分钟、30分钟-1小时、1-2小时、2-4小时、4-8小时、8-12小时和12-24小时。此外,还对比了一种简化模型,该模型在低血糖前最多4小时进行分类。我们使用ResNet和LSTM模型对血糖水平、胰岛素剂量和加速度数据进行了训练。结果表明,当分类九个类别时,LSTM模型表现更优。特别是针对特定个体的模型在性能上更优,但对第0、1和2类的召回率分别为98%、72%和50%。基于人群的六类模型提高了检测率,至少有60%的事件被检测到。相比之下,当前方法在更长的时间窗下仍然具有挑战性,可能需要使用不同的模型进行考虑。
arXiv:2504.00008v1 类型: cross
摘要: 我们提出了一种张量广义近似消息传递(TeG-AMP)算法,用于低秩张量推断,可用于解决张量完成和分解问题。我们通过在高维空间中应用中心极限定理和泰勒级数近似,推导出TeG-AMP算法,作为在高维空间中求和-乘积信念传播算法的近似。由于TeG-AMP基于普遍的TR分解模型开发,它可以应用于多种低秩张量类型。此外,我们的TeG-AMP可以根据CP分解模型简化,并提出了一种张量简化AMP算法,用于低CP秩张量推断问题。实验结果表明,所提出的方法显著提高了恢复性能,因为它充分利用了张量结构。
arXiv:2504.00002v1 交叉公告类型
摘要:大型语言模型(LLMs)的最新进展激发了在移动设备上部署这些模型的兴趣,以能够在不依赖云连接的情况下启用新的应用程序。然而,在资源受限的设备上部署LLMs的效率限制构成了重大挑战。在本文中,我们进行了一次全面的测量研究,评估了在移动端、边缘端和云端部署LLM应用程序之间的效率权衡。我们实现了一个简化的基于LLM的应用程序AutoLife-Lite,该应用程序通过分析智能手机传感器数据来推断用户位置和活动上下文。我们的实验发现:(1)只有小尺寸的LLM(<4B参数)能够在强大的移动设备上成功运行,尽管它们在质量上与大型模型相比存在限制;(2)模型压缩在降低硬件要求方面是有效的,但可能导致性能显著下降;(3)在移动设备上运行具有有意义输出的LLM的时间延迟显著(>30秒),而云服务表现出更好的时间效率(<10秒);(4)边缘部署在延迟和模型能力之间提供了中间权衡,但在基于CPU和基于GPU的环境中结果不同。这些发现为系统设计者提供了关于当前限制和未来方向的有价值见解,在移动端部署LLM应用程序方面。