LLM2D
REALM: 一个真实世界大模型使用案例数据集
REALM: A Dataset of Real-World LLM Use Cases
作者: Jingwen Cheng, Kshitish Ghate, Wenyue Hua, William Yang Wang, Hong Shen, Fei Fang
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2503.18792v1

摘要

arXiv:2503.18792v1 类型: cross 摘要:大型语言模型,如 GPT 系列,已经推动了重要的工业应用,带来了经济和社會的变革。然而,对它们在现实生活中的应用仍缺乏全面的理解。为了解决这一问题,我们引入了 REALM,一个包含超过 94,000 个来自 Reddit 和新闻文章的大型语言模型使用案例的数据集。REALM 捕捉了两个关键维度:大型语言模型的多样化应用和使用它们的用户的人口统计信息。它对大型语言模型的应用进行了分类,并探讨了用户的职业与他们使用的应用类型之间的关系。通过整合真实世界的数据,REALM 为不同领域的大型语言模型的采用提供了见解,为它们在社会角色方面的演变提供了一个基础。一个专门的仪表板 https://realm-e7682.web.app/ 展示了这些数据。