LLM2D
故事锚点:生成一致的多场景故事框架以构建长篇叙事
STORYANCHORS: Generating Consistent Multi-Scene Story Frames for Long-Form Narratives
作者: Bo Wang, Haoyang Huang, Zhiyin Lu, Fengyuan Liu, Guoqing Ma, Jianlong Yuan, Yuan Zhang, Nan Duan
发布日期: 5/14/2025
arXiv ID: oai:arXiv.org:2505.08350v1

摘要

arXiv:2505.08350v1 类型:交叉 摘要:本文介绍了一种名为StoryAnchors的统一框架,用于生成高质量、多场景的故事框架,并具有强烈的时间一致性。该框架采用双向故事生成器,结合过去和未来上下文以确保时间一致性、角色连续性和叙述中的平滑场景过渡。引入了特定条件来区分故事框架生成与标准视频合成,从而增加场景多样性并增强叙述丰富性。为进一步提高生成质量,StoryAnchors结合了多事件故事框架标注和渐进式故事框架训练,使模型能够捕捉宏观叙述流和事件级动态。这种方法支持创建可编辑和扩展的故事框架,允许手动修改和生成更长、更复杂的序列。广泛实验表明,StoryAnchors在一致性、叙述连贯性和场景多样性等方面优于现有的开源模型。其在叙述一致性和故事丰富性方面的性能也与GPT-4o相当。最终,StoryAnchors促进了以故事为导向的框架生成边界的突破,提供了一个可扩展、灵活且高度可编辑的基础框架,适用于未来的研究。