摘要
arXiv:2502.04756v1 交叉公告类型:cross
摘要:本文提出了一种新的方法论框架,使用开源大规模语言模型(LLMs)从文本数据中检测和分类潜在结构,包括框架、叙事和主题。提出的混合方法结合了自动总结与有人工参与的验证,以提高结构识别的准确性和可解释性。通过结合迭代采样和专家细化,该框架保证了方法论的稳健性并确保了概念上的精确性。该方法应用于包括AI政策辩论、加密报道新闻文章和20个新sgroup数据集在内的多样化数据集,展示了其在系统性分析复杂政治言论、媒体框架和主题分类任务方面的能力和灵活性。