摘要
arXiv:2502.17793v2 Announce Type: replace-cross
摘要:文本到图像(T2I)模型使得快速概念设计成为可能,从而在AI驱动设计中被广泛使用。尽管最近的研究集中在生成给定设计概念的语义和风格变体上,但功能一致性—将多种功能整合到一个连贯的概念中—仍然被很大程度上忽视了。在本文中,我们介绍了SYNTHIA,一种基于期望功能生成新颖且功能连贯设计的框架。我们的方法利用了层次概念本体,将概念分解为部分和功能,作为功能性连贯设计的重要构建块。我们还基于我们的本体开发了一种课程学习方案,结合对比目标微调T2I模型,逐步学习功能组合,同时保持视觉新颖性。具体而言,我们(i) 逐步增加功能距离,引导模型从基本概念-功能关联过渡到复杂的功能组合,这些组合将不同功能的部分整合为一个连贯的形式,并(ii) 通过采用对比目标强迫学习表示远离现有概念,以确保视觉新颖性。实验结果表明,SYNTHIA 在新颖性和功能一致性方面显著优于现有最先进的T2I模型,分别在人类评估中提高了25.1%和14.7%。