LLM2D

摘要

arXiv:2505.08350v1 类型:交叉摘要：本文介绍了一种名为StoryAnchors的统一框架，用于生成高质量、多场景的故事框架，并具有强烈的时间一致性。该框架采用双向故事生成器，结合过去和未来上下文以确保时间一致性、角色连续性和叙述中的平滑场景过渡。引入了特定条件来区分故事框架生成与标准视频合成，从而增加场景多样性并增强叙述丰富性。为进一步提高生成质量，StoryAnchors结合了多事件故事框架标注和渐进式故事框架训练，使模型能够捕捉宏观叙述流和事件级动态。这种方法支持创建可编辑和扩展的故事框架，允许手动修改和生成更长、更复杂的序列。广泛实验表明，StoryAnchors在一致性、叙述连贯性和场景多样性等方面优于现有的开源模型。其在叙述一致性和故事丰富性方面的性能也与GPT-4o相当。最终，StoryAnchors促进了以故事为导向的框架生成边界的突破，提供了一个可扩展、灵活且高度可编辑的基础框架，适用于未来的研究。