摘要
社交平台已成为传播信息和讨论现实社会事件的关键平台,为研究人员设计和实施新颖的事件检测框架提供了绝佳机会。然而,大多数现有方法仅利用关键词突发性或网络结构来检测未指定事件,因此在识别与事件和社交数据挑战性相关的未知事件方面常常力不从心。社交数据(例如推文)的特点是拼写错误、信息不完整、词义歧义、语言不规范以及意见表达方面的差异。此外,利用有限的结构知识来提取不断发展事件的区分性特征和模式几乎是不可行的。为了应对这些挑战,本文提出了一种新颖的框架EnrichEvent,该框架利用流式社交数据的语言和上下文表示。特别是,我们利用上下文和语言知识来检测语义相关的推文,并提高事件检测方法的有效性。最终,我们提出的框架为每个事件生成聚类链,以显示事件随时间的演变变化。我们进行了大量的实验来评估我们的框架,验证了其在检测和区分未指定社会事件方面的高性能和有效性。