LLM2D

摘要

arXiv:2412.16247v2 宣告类型: replace-cross 摘要：字典学习（DL）已成为大型语言模型解释性的强大工具。通过从人类可解释的数据（例如文本）中提取已知概念（例如金门大桥），稀疏DL可以阐明模型的内部工作机制。在本文中，我们询问DL是否也可以用于从较少人类可解释的科学数据（例如细胞图像）中发现未知概念，从而最终使现代科学发现方法得到增强。作为第一步，我们使用DL算法研究了训练在多细胞图像数据上的显微镜基础模型，在这些模型中，很少有关于哪些高层概念应该出现的先验知识。我们展示了确实可以提取出生物学上有意义的概念，如细胞类型和基因扰动类型。我们还提出了迭代代码本特征学习（ICFL），并将其与预处理步骤结合，该步骤使用来自对照数据集的PCA白化技术。在我们的实验中，我们证明了与TopK稀疏自编码器相比，ICFL和PCA在提取出的选择性特征方面有所改进。