LLM2D

摘要

arXiv:2505.09724v1 宣布类型: 横跨领域摘要：分析开放生成的回答、标题或社交媒体帖子等文本是一种耗时且劳动密集型的过程，极易受到偏见的影响。大规模语言模型（LLMs）是进行文本分析的有前景的工具，可以使用预定义的（自上而下）或数据驱动的（自下而上）分类法，而不牺牲质量。在这里，我们提供了一步步的教程，通过研究者和LLMs的迭代和协作过程，高效地开发、测试和应用分析非结构化数据的分类法。以参与者提供的个人目标为例，我们展示了如何编写提示来审查数据集，并生成生活领域的分类法，如何通过提示和直接修改来评估和完善分类法，如何测试分类法并评估编码者间的一致性，以及如何将分类法应用于整个数据集，并实现高编码者一致性分类。我们讨论了使用LLMs进行文本分析的可能性和局限性。