LLM2D
基于开源大型语言模型处理的概念导航与分类
Concept Navigation and Classification via Open-Source Large Language Model Processing
作者: Ma\"el Kubli
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2502.04756v2

摘要

arXiv:2502.04756v2 宣告类型: replace-cross 摘要:本文提出了一种新的方法学框架,利用开源大型语言模型(LLMs)从文本数据中检测和分类潜在构造,包括框、叙述和主题。提出的混合方法将自动总结与人工在环验证相结合,以提高结构识别的准确性和可解释性。通过结合迭代采样与专家 refinement,该框架保证了方法学的稳健性并确保了概念的精确性。该方法应用于多元化的数据集,包括人工智能政策辩论、加密新闻文章和20个新sgroups数据集,展示了其在系统分析复杂政治言论、媒体框架和主题分类任务中的灵活性。