LLM2D
谁拥有输出?在大规模语言模型 attribution 中法律与技术的桥梁
Who Owns the Output? Bridging Law and Technology in LLMs Attribution
作者: Emanuele Mezzi, Asimina Mertzani, Michael P. Manis, Siyanna Lilova, Nicholas Vadivoulis, Stamatis Gatirdakis, Styliani Roussou, Rodayna Hmede
发布日期: 4/3/2025
arXiv ID: oai:arXiv.org:2504.01032v1

摘要

arXiv:2504.01032v1 交叉类型: cross 摘要:自2022年推出ChatGPT以来,大型语言模型(LLMs)和大型多模态模型(LMMs)已经改变了内容创作,它们能够生成高质量的人类级内容,涵盖所有媒介,包括文本、图像、视频和音频。生成人工智能模型提供的机会是无限的,极大地缩短了生成内容所需的时间,通常提高了生成的质量。然而,考虑到生成内容的复杂性和难以追踪性,使用这些工具在归因AI生成内容方面提供了挑战。归因的困难源于多个原因,从生成内容缺乏系统的指纹标识到最后一种,即LLMs和LMMs训练数据的巨大数量,这使得将生成内容与训练数据联系起来变得困难。这种情景引发了对知识产权和道德责任的担忧。为了解决这些问题,在本文中,我们通过提出目前可用的立法和技术工具的审查,并提出一个确保问责的法律框架,将技术和法律方面结合起来。最终,我们提出了三种这可以结合使用的方法,以确保归因得以尊重。尽管当今可用的技术可以在很大程度上确保更广泛的归因,但仍然存在强大的限制,这些限制只能通过开发适用于LLMs和LMMs的新归因技术来解决。