LLM2D

摘要

arXiv:2502.12048v1 通告类型: 新闻摘要: 将脑机接口(BCI)与生成人工智能(GenAI)集成开启了脑信号解码的新前沿，使其能够实现辅助沟通、神经表示学习和多模态集成。BCIs，尤其是利用脑电图(EEG)技术的接口，提供了一种非侵入性的方法，将神经活动转换为有意义的输出。近年来，包括生成对抗网络(GANs)和基于变换器的大型语言模型(LLMs)在内的深度学习进步显著提高了基于EEG的图像、文本和语音生成技术。本文对基于EEG的多模态生成进行了文献综述，重点介绍了(i)通过GANs、变分自编码器(VAEs)和扩散模型实现的EEG到图像生成，以及(ii)通过基于变换器的语言模型和对比学习方法实现的EEG到文本生成。此外，我们讨论了脑电图到语音合成的新兴领域，这是一个不断发展的多模态前沿。我们强调了生成方法背后的关键数据集、用例、挑战和EEG特征编码方法。通过提供基于EEG的生成AI的结构化概述，本文旨在为研究人员和实践者提供见解，以促进神经解码、增强辅助技术并扩展脑机交互的边界。