LLM2D

摘要

arXiv:2502.17793v2 Announce Type: replace-cross 摘要：文本到图像（T2I）模型使得快速概念设计成为可能，从而在AI驱动设计中被广泛使用。尽管最近的研究集中在生成给定设计概念的语义和风格变体上，但功能一致性—将多种功能整合到一个连贯的概念中—仍然被很大程度上忽视了。在本文中，我们介绍了SYNTHIA，一种基于期望功能生成新颖且功能连贯设计的框架。我们的方法利用了层次概念本体，将概念分解为部分和功能，作为功能性连贯设计的重要构建块。我们还基于我们的本体开发了一种课程学习方案，结合对比目标微调T2I模型，逐步学习功能组合，同时保持视觉新颖性。具体而言，我们(i) 逐步增加功能距离，引导模型从基本概念-功能关联过渡到复杂的功能组合，这些组合将不同功能的部分整合为一个连贯的形式，并(ii) 通过采用对比目标强迫学习表示远离现有概念，以确保视觉新颖性。实验结果表明，SYNTHIA 在新颖性和功能一致性方面显著优于现有最先进的T2I模型，分别在人类评估中提高了25.1%和14.7%。