LLM2D

摘要

大型视觉-语言模型（LVLMs）随着视觉模块的加入，迅速发展成为更加类人化的模型。然而，我们应该谨慎评估它们在不同领域的应用，因为它们可能存在不希望的偏见。我们的工作从行为金融学的角度研究了LVLMs的潜在行为偏见，这是一个结合了金融和心理学的跨学科课题。我们提出了一个端到端的框架，从数据收集到新的评估指标，以评估LVLMs的推理能力和在两种已建立的人类金融行为偏见中的动态行为：近期偏见和权威偏见。我们的评估发现，最近的开放源代码LVLMs如LLaVA-NeXT、MobileVLM-V2、Mini-Gemini、MiniCPM-Llama3-V 2.5和Phi-3-vision-128k在这两种偏见上受到显著影响，而专有模型GPT-4o则几乎不受影响。我们的观察指出了开源模型可以改进的方向。代码可在https://github.com/mydcxiao/vlm_behavioral_fin获取。