LLM2D

摘要

arXiv:2504.20340v1 通知类型: 新闻摘要: 随着人工智能生成内容在互联网、社交媒体和其他数字平台上变得无所不在，研究这种内容是如何被激发和生成的变得至关重要。人工智能生成图像的创作通常涉及对输入提示进行迭代优化，以实现预期的视觉效果。本研究重点关注相对较少探索的通过人工智能进行图像再生的概念，即一个人类操作者通过迭代优化其提示来尽量精细地再现特定目标图像。图像再生与缺乏预设视觉参考的普通图像生成不同。另一个挑战在于，在我们尚未完全理解主观人类相似度判断与现有图像相似度度量（ISM）的一致性的情况下，如何确定现有图像相似度度量是否能提供可靠、客观的反馈意见。因此，我们必须首先验证这些度量与人类感知的一致性，然后再评估它们在迭代提示优化过程中作为反馈机制的潜力。为解决这些研究缺口，我们进行了一项结构化用户研究，评估了迭代提示优化如何影响再生图像与目标图像的相似性，同时考察现有图像相似度度量是否捕捉到了人类观察者感知到的相同改进。我们的研究结果表明，逐步调整提示显著提高了对齐度，主观评估和定量度量都验证了这一点，强调了迭代工作流在跨各种应用领域提升生成人工智能内容创造的整体潜力。