LLM2D
实时医疗对话语音摘要
Real-time Speech Summarization for Medical Conversations
作者: Khai Le-Duc, Khai-Nguyen Nguyen, Long Vo-Dang, Truong-Son Hy
发布日期: 4/7/2025
arXiv ID: oai:arXiv.org:2406.15888v2

摘要

arXiv:2406.15888v2 会议类型:替换交叉 摘要:在医生与患者的对话中,识别医学相关的信息至关重要,这提出了对话总结的需求。在本文中,我们提出了一套初步部署的实时语音总结系统,该系统适用于工业领域的实际应用。该系统在每次对话中每N个语音片段后生成局部摘要,在对话结束时生成全局摘要。该系统在商业角度可以提升用户体验,技术角度可以减少计算成本。其次,我们提出了VietMed-Sum,据我们所知,这是第一个用于医疗对话的语音总结数据集。第三,我们首次利用大型语言模型和人类注释员协力创建医疗对话的黄金标准和合成摘要。最后,我们在VietMed-Sum上展示了最先进的模型的基线结果。所有代码、数据(英文翻译和越南文)和模型均可在线获得:https://github.com/leduckhai/MultiMed/tree/master/VietMed-Sum