摘要
ChatGPT 和其他最先进的大型语言模型 (LLM) 正在迅速改变多个领域,为各种应用提供强大的工具。这些模型通常在海量数据集上进行训练,展现出类似人类的文本生成能力,使其在研究任务中发挥作用,例如构思、文献综述、编码、起草和外展。我们进行了一项研究,涉及 13 位不同职业阶段和研究领域的宇航员,以探索 LLM 在多个月内跨不同任务的应用,并评估其在研究相关活动中的表现。这项工作伴随着一项匿名调查,评估了参与者对 LLM 的体验和态度。我们对尝试的任务和调查答案进行了详细分析,并提供了具体的输出示例。我们的发现突出了 LLM 在支持研究方面的潜力和局限性,同时也探讨了一般性和研究特异性的伦理考量。我们以一系列建议作为总结,强调研究人员需要将批判性思维和领域专业知识与 LLM 结合起来,确保这些工具作为辅助而不是替代严格的科学探究。