摘要
arXiv:2501.18794v1 宣告类型:交叉
摘要:由于患者数据有限和基因多样性,罕见疾病诊断极具挑战性。尽管变体优先排序方面取得了进展,但仍有许多病例未被诊断出来。虽然大型语言模型(LLMs)在医学考试中表现良好,但它们在诊断罕见遗传疾病方面的有效性尚未得到评估。为了识别致病基因,我们对各种LLMs进行了基因优先排序的基准测试。通过多智能体和人类表型 ontology(HPO)分类,我们根据表型和可解性级别对患者进行了分类。随着基因集合的增大,LLM的性能逐渐下降,因此我们采用了分而治之的策略将任务划分为更小的部分。在基准测试中,GPT-4 超过了其他LLMs,实现了近30%的准确率,在排序致病基因方面正确度较高。多智能体和HPO方法有助于区分明确解决的情况和具有挑战性的病例,突显了已知基因-表型关联和表型特异性的的重要性。我们发现,具有特定表型或明确关联的病例更有可能被准确解决。然而,我们观察到对已研究充分的基因的偏见和输入顺序的敏感性,这阻碍了基因优先排序。我们的分而治之策略通过克服这些偏见提高了准确性。通过利用HPO分类、新颖的多智能体技术以及我们的LLM策略,我们相较于基线评估提高了致病基因识别的准确性。该方法简化了罕见疾病的诊断、促进了未解病例的重新分析,并加速了基因发现,支持了针对诊断和治疗的靶向开发。