摘要
arXiv:2502.12048v1 通告类型: 新闻
摘要: 将脑机接口(BCI)与生成人工智能(GenAI)集成开启了脑信号解码的新前沿,使其能够实现辅助沟通、神经表示学习和多模态集成。BCIs,尤其是利用脑电图(EEG)技术的接口,提供了一种非侵入性的方法,将神经活动转换为有意义的输出。近年来,包括生成对抗网络(GANs)和基于变换器的大型语言模型(LLMs)在内的深度学习进步显著提高了基于EEG的图像、文本和语音生成技术。本文对基于EEG的多模态生成进行了文献综述,重点介绍了(i)通过GANs、变分自编码器(VAEs)和扩散模型实现的EEG到图像生成,以及(ii)通过基于变换器的语言模型和对比学习方法实现的EEG到文本生成。此外,我们讨论了脑电图到语音合成的新兴领域,这是一个不断发展的多模态前沿。我们强调了生成方法背后的关键数据集、用例、挑战和EEG特征编码方法。通过提供基于EEG的生成AI的结构化概述,本文旨在为研究人员和实践者提供见解,以促进神经解码、增强辅助技术并扩展脑机交互的边界。