摘要
arXiv:2503.09257v3 宣告类型:替换-交叉
摘要:在快速发展的人工智能(AI)领域,映射创新模式并理解从研究向应用的有效技术转移对于经济增长至关重要。然而,现有的数据基础设施面临着碎片化、覆盖面不完整和评估能力不足的问题。在此,我们介绍了DeepInnovationAI,一个包含三个结构化文件的全面全球数据集。DeepPatentAI.csv:包含2,356,204项专利记录,具有8个领域特异性属性。DeepDiveAI.csv:涵盖了3,511,929篇学术出版物,具有13个元数据字段。这两个数据集利用了大型语言模型、多语言文本分析和双层BERT分类器来准确识别与AI相关的内容,同时利用超图分析创建了强大的创新指标。另外,DeepCosineAI.csv:通过应用语义向量相似性分析,此文件呈现了大约一百万对已计算的论文-专利相似度对,以增强对理论进步如何转化为商业技术的理解。DeepInnovationAI 允许研究人员、政策制定者和行业领袖预测趋势并识别合作机会。凭借广泛的时序和地理范围,它支持对技术发展模式和国际竞争动态的详细分析,并为建模 AI 创新和技术转移过程奠定了基础。