LLM2D
真正创新有效的检测基准,由WITNESS开发
TRIED: Truly Innovative and Effective Detection Benchmark, developed by WITNESS
发布日期: 5/1/2025
arXiv ID: oai:arXiv.org:2504.21489v1

摘要

arXiv:2504.21489v1 公布类型:交叉 摘要:生成式人工智能和欺骗性合成媒体的兴起威胁着全球信息生态系统,尤其是在全球大多数国家和地区。见证组织的这份报告指出现代的AI检测工具在实际应用场景中常常由于可解释性、公平性、可访问性以及情境相关性的挑战而表现不佳。针对这种情况,见证组织提出了真正创新和有效的AI检测(TRIED)基准,这是一种新的框架,用于根据其在现实世界中的影响和创新潜力评估检测工具。报告基于前线经验、欺骗性AI案例以及全球咨询,概述了检测工具必须通过满足多元的语言、文化和技术背景来真正实现创新和相关性。它为开发人员、政策制定者和标准机构提供了实用指南,以设计负责任、透明和用户中心的检测解决方案,并将社会技术考量纳入未来的AI标准、程序和评估框架中。通过采用TRIED基准,利益相关者可以推动创新,保护公众信任,增强AI素养,并为更强大的全球信息信誉做出贡献。