LLM2D

摘要

arXiv:2502.04756v2 宣告类型: replace-cross 摘要：本文提出了一种新的方法学框架，利用开源大型语言模型（LLMs）从文本数据中检测和分类潜在构造，包括框、叙述和主题。提出的混合方法将自动总结与人工在环验证相结合，以提高结构识别的准确性和可解释性。通过结合迭代采样与专家 refinement，该框架保证了方法学的稳健性并确保了概念的精确性。该方法应用于多元化的数据集，包括人工智能政策辩论、加密新闻文章和20个新sgroups数据集，展示了其在系统分析复杂政治言论、媒体框架和主题分类任务中的灵活性。