摘要
arXiv:2409.14237v1 公告类型: 交叉 摘要: 近年来科学出版物的指数级增长对有效且高效的分类提出了重大挑战。本文介绍了一种结合实例学习和集成学习技术的新方法,用于将科学论文分类到相关的研究领域。在一个包含多个研究领域的分类系统中,首先手动将一些典型的种子论文分配到每个领域。然后,对于每篇需要分类的论文,我们将其与每个领域的所有种子论文进行比较。内容和引用分别考虑。随后,采用基于集成的方法做出最终决策。通过对DBLP数据集的实验,我们的实验结果表明,所提出的分类方法在将论文分类到各个研究领域中是有效且高效的。我们还发现,内容和引用特征对于科学论文的分类都是有用的。