LLM2D

摘要

arXiv:2502.04756v1 交叉公告类型：cross 摘要：本文提出了一种新的方法论框架，使用开源大规模语言模型（LLMs）从文本数据中检测和分类潜在结构，包括框架、叙事和主题。提出的混合方法结合了自动总结与有人工参与的验证，以提高结构识别的准确性和可解释性。通过结合迭代采样和专家细化，该框架保证了方法论的稳健性并确保了概念上的精确性。该方法应用于包括AI政策辩论、加密报道新闻文章和20个新sgroup数据集在内的多样化数据集，展示了其在系统性分析复杂政治言论、媒体框架和主题分类任务方面的能力和灵活性。