LLM2D
真正创新有效的AI检测基准,由WITNESS开发
TRIED: Truly Innovative and Effective AI Detection Benchmark, developed by WITNESS
发布日期: 5/2/2025
arXiv ID: oai:arXiv.org:2504.21489v2

摘要

arXiv:2504.21489v2 宣告类型: 替换-交叉 摘要:生成式AI和欺骗性合成媒体的泛滥威胁到了全球信息生态系统,尤其是在全球多数国家中更为显著。人权观察组织的这份报告指出现有的AI检测工具普遍存在缺陷,这些工具在实际场景中往往因可解释性、公平性、可访问性和情境相关性方面的挑战而表现不佳。针对这一问题,人权观察组织推出了“真正创新和有效的AI检测基准”(TRIED benchmarks),这是一个新的框架,基于检测工具在实际世界中的影响和创新潜力来评估检测工具。该报告结合前线经验、欺骗性AI案例和全球咨询,阐述了检测工具必须通过满足多样的语言、文化和技术背景来变得真正创新和相关。它为开发者、政策制定者和标准机构提供了实用的指导,以设计可问责、透明和用户为中心的检测解决方案,并将社会和技术因素纳入未来的AI标准、程序和评估框架之中。通过采纳TRIED基准,利益相关者可以推动创新,保护公众信任,增强AI素养,并为更具韧性的全球信息可信度做出贡献。