摘要
arXiv:2504.03665v1 跨域公告类型:交叉
摘要:大型语言模型(LLMs),如GPT-4和DeepSeek,已在软件工程的多个领域得到应用。然而,在高性能计算(HPC)的背景下,它们的潜力仍然有待探索。本文评估了最近的LLM DeepSeek在生成一组HPC基准代码方面的表现:共轭梯度求解器、并行热方程、并行矩阵乘法、DGEMM以及STREAM三元操作。我们分析了DeepSeek在C++、Fortran、Julia和Python等传统HPC语言的代码生成能力。评估包括对代码正确性、性能以及在不同配置和矩阵大小下的扩展性的测试。我们还提供了DeepSeek与另一个广泛使用的工具GPT-4之间的详细比较。结果表明,尽管DeepSeek能够生成适用于HPC任务的功能性代码,但在生成代码的可扩展性和执行效率方面仍落后于GPT-4。