LLM2D

摘要

arXiv:2504.04855v1 公告类型: 新摘要: 在结构化数据中检测偏差是一项复杂且耗时的任务。现有的自动化技术在数据类型多样性方面受到限制，并且高度依赖于人工逐案处理，导致缺乏普适性。目前，基于大型语言模型（LLM）的代理已经在数据科学领域取得了显著进展，但它们检测数据偏差的能力仍然没有得到充分探索。为了解决这一缺口，我们引入了第一个端到端的多智能体协同框架BIASINSPECTOR，该框架旨在根据特定用户需求自动检测结构化数据中的偏差。首先，它制定一个多阶段计划来分析用户指定的偏差检测任务，然后用一组多样且合适的工具来实现。它提供了详细的分析结果，包括解释和可视化。为了解决目前缺乏标准化框架来评估LLM代理检测数据偏差能力的问题，我们进一步提出了一项全面基准，其中包括多种评价指标和大量测试用例。大量实验表明，我们的框架在结构化数据偏差检测方面实现了卓越的整体性能，为更公平的数据应用设立了新里程碑。