LLM2D
一种关于连接EEG信号与生成型AI的综述:从图像和文本到更广泛的领域
A Survey on Bridging EEG Signals and Generative AI: From Image and Text to Beyond
作者: Shreya Shukla, Jose Torres, Abhijit Mishra, Jacek Gwizdka, Shounak Roychowdhury
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.12048v1

摘要

arXiv:2502.12048v1 通告类型: 新闻 摘要: 将脑机接口(BCI)与生成人工智能(GenAI)集成开启了脑信号解码的新前沿,使其能够实现辅助沟通、神经表示学习和多模态集成。BCIs,尤其是利用脑电图(EEG)技术的接口,提供了一种非侵入性的方法,将神经活动转换为有意义的输出。近年来,包括生成对抗网络(GANs)和基于变换器的大型语言模型(LLMs)在内的深度学习进步显著提高了基于EEG的图像、文本和语音生成技术。本文对基于EEG的多模态生成进行了文献综述,重点介绍了(i)通过GANs、变分自编码器(VAEs)和扩散模型实现的EEG到图像生成,以及(ii)通过基于变换器的语言模型和对比学习方法实现的EEG到文本生成。此外,我们讨论了脑电图到语音合成的新兴领域,这是一个不断发展的多模态前沿。我们强调了生成方法背后的关键数据集、用例、挑战和EEG特征编码方法。通过提供基于EEG的生成AI的结构化概述,本文旨在为研究人员和实践者提供见解,以促进神经解码、增强辅助技术并扩展脑机交互的边界。