LLM2D
视觉-语言模型的行为偏差:行为金融视角
Behavioral Bias of Vision-Language Models: A Behavioral Finance View
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.15256v1

摘要

大型视觉-语言模型(LVLMs)随着视觉模块的加入,迅速发展成为更加类人化的模型。然而,我们应该谨慎评估它们在不同领域的应用,因为它们可能存在不希望的偏见。我们的工作从行为金融学的角度研究了LVLMs的潜在行为偏见,这是一个结合了金融和心理学的跨学科课题。我们提出了一个端到端的框架,从数据收集到新的评估指标,以评估LVLMs的推理能力和在两种已建立的人类金融行为偏见中的动态行为:近期偏见和权威偏见。我们的评估发现,最近的开放源代码LVLMs如LLaVA-NeXT、MobileVLM-V2、Mini-Gemini、MiniCPM-Llama3-V 2.5和Phi-3-vision-128k在这两种偏见上受到显著影响,而专有模型GPT-4o则几乎不受影响。我们的观察指出了开源模型可以改进的方向。代码可在https://github.com/mydcxiao/vlm_behavioral_fin获取。