LLM2D

摘要

arXiv:2504.03665v1 跨域公告类型：交叉摘要：大型语言模型（LLMs），如GPT-4和DeepSeek，已在软件工程的多个领域得到应用。然而，在高性能计算（HPC）的背景下，它们的潜力仍然有待探索。本文评估了最近的LLM DeepSeek在生成一组HPC基准代码方面的表现：共轭梯度求解器、并行热方程、并行矩阵乘法、DGEMM以及STREAM三元操作。我们分析了DeepSeek在C++、Fortran、Julia和Python等传统HPC语言的代码生成能力。评估包括对代码正确性、性能以及在不同配置和矩阵大小下的扩展性的测试。我们还提供了DeepSeek与另一个广泛使用的工具GPT-4之间的详细比较。结果表明，尽管DeepSeek能够生成适用于HPC任务的功能性代码，但在生成代码的可扩展性和执行效率方面仍落后于GPT-4。