LLM2D

摘要

arXiv:2504.21489v2 宣告类型: 替换-交叉摘要：生成式AI和欺骗性合成媒体的泛滥威胁到了全球信息生态系统，尤其是在全球多数国家中更为显著。人权观察组织的这份报告指出现有的AI检测工具普遍存在缺陷，这些工具在实际场景中往往因可解释性、公平性、可访问性和情境相关性方面的挑战而表现不佳。针对这一问题，人权观察组织推出了“真正创新和有效的AI检测基准”（TRIED benchmarks），这是一个新的框架，基于检测工具在实际世界中的影响和创新潜力来评估检测工具。该报告结合前线经验、欺骗性AI案例和全球咨询，阐述了检测工具必须通过满足多样的语言、文化和技术背景来变得真正创新和相关。它为开发者、政策制定者和标准机构提供了实用的指导，以设计可问责、透明和用户为中心的检测解决方案，并将社会和技术因素纳入未来的AI标准、程序和评估框架之中。通过采纳TRIED基准，利益相关者可以推动创新，保护公众信任，增强AI素养，并为更具韧性的全球信息可信度做出贡献。