LLM2D

摘要

arXiv:2501.10928v2 Announce Type: replace-cross 摘要：生成型人工智能（AI）通过使机器能够以前所未有的复杂程度创建和解释视觉数据，迅速推动了计算机视觉领域的发展。这场变革建立在生成模型的基础之上，生成逼真的图像、视频和3D/4D内容。传统的生成模型主要集中在视觉保真度上，但在生成内容的物理合理性方面经常有所忽视。这一差距限制了它们在需要遵守现实世界物理定律的应用中的有效性，例如机器人技术、自主系统和科学模拟。随着生成模型越来越能够结合物理真实性和动态模拟，它们作为“世界模拟器”的潜力也在不断扩大。因此，物理感知生成在计算机视觉领域的研究正在迅速增长，需要一个全面的综述来提供结构化的当前努力分析。为了实现这一目的，综述文章呈献了一个系统性的回顾，根据它们如何整合物理知识对方法进行分类，这些知识可以通过显式的模拟或隐式的学习来获得。同时，综述文章分析了关键的范式，讨论了评估协议，并指出了未来的研究方向。通过提供一个全面的概述，这篇综述旨在帮助未来在物理基线生成领域的计算机视觉研究发展。被审查的论文总结可在 https://tinyurl.com/Physics-Aware-Generation 获取。