LLM2D
XiHe融合:利用大型语言模型进行核聚变科学传播
XiHeFusion: Harnessing Large Language Models for Science Communication in Nuclear Fusion
作者: Xiao Wang, Qingquan Yang, Fuling Wang, Qiang Chen, Wentao Wu, Yu Jin, Jingtao Jiang, Liye Jin, Bo Jiang, Dengdi Sun, Wanli Lv, Meiwen Chen, Zehua Chen, Guosheng Xu, Jin Tang
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05615v1

摘要

arXiv:2502.05615v1 类别:交叉学科 摘要:核聚变是人类获得无限能量最有希望的方式之一。目前,随着人工智能的迅速发展,核聚变的任务也进入了其发展的关键时期。让更多的人了解核聚变并加入其研究是加速实施聚变的有效手段之一。本文提出了核聚变领域的第一个大型模型——XiHeFusion,该模型基于开源的大规模模型Qwen2.5-14B进行监督微调获得。我们收集了关于核聚变任务的多源知识,以支持该模型的训练,包括通用爬虫、电子书、arXiv、论文等。在模型掌握了核聚变领域的知识后,我们进一步使用思维链来增强其逻辑推理能力,使XiHeFusion能够提供更准确和逻辑性的答案。此外,我们还提出了一份包含180多个问题的测试问卷来评估此科学普及大型模型的对话能力。广泛的实验结果表明,我们的核聚变对话模型XiHeFusion在回答科学普及知识方面表现良好。预训练的XiHeFusion模型已发布在https://github.com/Event-AHU/XiHeFusion。