LLM2D
认知艺术:大型语言模型在艺术品分析和解码美学元素中的应用
CognArtive: Large Language Models for Automating Art Analysis and Decoding Aesthetic Elements
作者: Afshin Khadangi, Amir Sartipi, Igor Tchappi, Gilbert Fridgen
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2502.04353v1

摘要

arXiv:2502.04353v1 类型: cross 摘要: 作为一种通用语言,艺术可以被多种方式解释,艺术品蕴含着深刻的意义和细微差别。随着大型语言模型(LLMs)以及多模态大型语言模型(MLLMs)的出现,人们提出了这些问题:这些变革性的模型如何被用来评估和解读艺术品的艺术元素。尽管在这一领域已经进行了研究,但据我们所知,使用LLMs来深入细致地理解艺术品的技术和表现特征尚未得到探讨。在这项研究中,我们探讨了一种正式的艺术分析框架的自动化,以快速分析大量艺术品,并检查它们的模式如何随时间演变。我们探讨了LLMs如何解码艺术表达、视觉元素、构成和技巧,揭示了在不同时间段逐渐浮现的趋势。最后,我们讨论了LLMs在这种环境下的优势和局限性,强调了它们能够处理大量与艺术相关数据并生成深刻解释的能力。由于结果详尽且细致,我们开发了互动数据可视化工具,并已在线发布(https://cognartive.github.io/),以增强理解和可访问性。