摘要
arXiv:2504.13947v1 Announce Type: 横向
摘要:在本文中,我们引入了一种推测性设计方法,用于研究生成式人工智能系统的行为,将设计定位于一种探究方式。我们提议将看似无关的领域结合在一起,以产生故意的内容空缺,使用这些任务作为探针,引发AI模型的行为。我们通过一个案例研究进行了演示:探测ChatGPT系统(GPT-4和DALL-E),以从专业简历(CV)中生成头像。与传统方法不同,我们的方法评估系统在极端不确定性条件下的行为——被迫发明整个缺失内容时,揭示了微妙的刻板印象和价值观导向的假设。我们定性分析了系统如何解释简历中的身份和能力标志,并在缺乏上下文(如物理描述)的情况下将其转化为视觉肖像。我们展示了在这种内容空缺的背景下,AI系统生成了有偏见的表示,可能依赖于刻板印象关联或明显的幻觉。