摘要
本研究探讨了大型语言模型(LLMs)在创建反映和共鸣于个体读者身份的个性化“镜像故事”方面的有效性,以应对文学中显著的多样性缺失问题。我们提出了MirrorStories,一个包含1500个个性化短篇故事的语料库,这些故事通过整合姓名、性别、年龄、种族、读者兴趣和故事道德等元素生成。我们展示了LLMs能够有效地将多样化的身份元素融入叙事中,人类评估者能够高精度地识别故事中的个性化元素。通过涉及26位多样化人类评审员的全面评估,我们比较了MirrorStories与普通叙事的有效性。结果表明,个性化的LLM生成故事不仅在所有参与度指标上超过了普通人类写作和LLM生成的故事(在5分制评分中平均得分为4.22对比3.37),而且在保持预期道德的同时实现了更高的文本多样性。我们还提供了包括偏见评估和将图像整合到个性化故事中的潜力研究在内的分析。