LLM2D

摘要

arXiv:2406.07025v2 通报类型: replace-cross 摘要: 药物发现的目标是识别具有特定药理性质的化学化合物，这些化合物能够与特定的结合靶点相结合。现有的大型语言模型（LLMs）在分子生成方面可以实现高概率的令牌匹配得分。然而，仅仅依赖于LLM解码往往会生成由于单个令牌误用而导致无效的分子，或者由于LLM先前经验导致的探索与利用不平衡而导致的次优分子。在这里，我们提出了一种名为ERP（Entropy-Reinforced Planning for Transformer Decoding）的方法，该方法使用熵增强的规划算法来增强变压器解码过程，并在探索与利用之间取得平衡。ERP旨在在多个属性上优于直接从变压器中采样的方法。我们在SARS-CoV-2病毒（3CLPro）和人类癌细胞靶蛋白（RTCB）基准上评估了ERP，并证明在两个基准中，ERP分别比当前最先进的算法提高了1-5个百分点，比基线提高了5-10个百分点。此外，这种改进在使用不同目标训练的变压器模型中是稳健的。最后，为了进一步展示ERP的能力，我们在三个代码生成基准上测试了我们的算法，也优于当前最先进的方法。我们的代码可在以下地址公开获取：https://github.com/xuefeng-cs/ERP。