LLM2D

摘要

arXiv:2501.18794v1 宣告类型：交叉摘要：由于患者数据有限和基因多样性，罕见疾病诊断极具挑战性。尽管变体优先排序方面取得了进展，但仍有许多病例未被诊断出来。虽然大型语言模型（LLMs）在医学考试中表现良好，但它们在诊断罕见遗传疾病方面的有效性尚未得到评估。为了识别致病基因，我们对各种LLMs进行了基因优先排序的基准测试。通过多智能体和人类表型 ontology（HPO）分类，我们根据表型和可解性级别对患者进行了分类。随着基因集合的增大，LLM的性能逐渐下降，因此我们采用了分而治之的策略将任务划分为更小的部分。在基准测试中，GPT-4 超过了其他LLMs，实现了近30%的准确率，在排序致病基因方面正确度较高。多智能体和HPO方法有助于区分明确解决的情况和具有挑战性的病例，突显了已知基因-表型关联和表型特异性的的重要性。我们发现，具有特定表型或明确关联的病例更有可能被准确解决。然而，我们观察到对已研究充分的基因的偏见和输入顺序的敏感性，这阻碍了基因优先排序。我们的分而治之策略通过克服这些偏见提高了准确性。通过利用HPO分类、新颖的多智能体技术以及我们的LLM策略，我们相较于基线评估提高了致病基因识别的准确性。该方法简化了罕见疾病的诊断、促进了未解病例的重新分析，并加速了基因发现，支持了针对诊断和治疗的靶向开发。