LLM2D
Home
Arxiv
返回列表
UD-英汉儿童语料库:金数据和银数据普遍依存树集合资源
UD-English-CHILDES: A Collected Resource of Gold and Silver Universal Dependencies Trees for Child Language Interactions
作者:
Xiulin Yang, Zhuoxuan Ju, Lanni Bu, Zoey Liu, Nathan Schneider
发布日期:
5/6/2025
arXiv ID:
oai:arXiv.org:2504.20304v2
摘要
arXiv:2504.20304v2 更新类型: 替换-交叉 摘要: CHILDES 是一个广泛使用的儿童及其面向儿童的言语的转录资源。本文介绍了 UD-English-CHILDES,这是第一个基于之前依赖注释的 CHILDES 数据并采用一致和统一注释准则的通用依赖树库。我们的语料库汇聚了来自 11 名儿童及其照顾者的注释,总计超过 48,000 个句子。我们在 UD v2 框架下验证了现有金标准注释,并提供了额外的 100 万个银标准句子,为计算和语言研究提供了一致的资源。
查看原文
下载 PDF