摘要
arXiv:2504.04855v1
公告类型: 新
摘要: 在结构化数据中检测偏差是一项复杂且耗时的任务。现有的自动化技术在数据类型多样性方面受到限制,并且高度依赖于人工逐案处理,导致缺乏普适性。目前,基于大型语言模型(LLM)的代理已经在数据科学领域取得了显著进展,但它们检测数据偏差的能力仍然没有得到充分探索。为了解决这一缺口,我们引入了第一个端到端的多智能体协同框架BIASINSPECTOR,该框架旨在根据特定用户需求自动检测结构化数据中的偏差。首先,它制定一个多阶段计划来分析用户指定的偏差检测任务,然后用一组多样且合适的工具来实现。它提供了详细的分析结果,包括解释和可视化。为了解决目前缺乏标准化框架来评估LLM代理检测数据偏差能力的问题,我们进一步提出了一项全面基准,其中包括多种评价指标和大量测试用例。大量实验表明,我们的框架在结构化数据偏差检测方面实现了卓越的整体性能,为更公平的数据应用设立了新里程碑。