摘要
arXiv:2502.04756v2 宣告类型: replace-cross
摘要:本文提出了一种新的方法学框架,利用开源大型语言模型(LLMs)从文本数据中检测和分类潜在构造,包括框、叙述和主题。提出的混合方法将自动总结与人工在环验证相结合,以提高结构识别的准确性和可解释性。通过结合迭代采样与专家 refinement,该框架保证了方法学的稳健性并确保了概念的精确性。该方法应用于多元化的数据集,包括人工智能政策辩论、加密新闻文章和20个新sgroups数据集,展示了其在系统分析复杂政治言论、媒体框架和主题分类任务中的灵活性。