摘要
arXiv:2505.00035v1 宣告类型:交叉
摘要:本文提出了一个全面的计算框架,用于分析嘻哈歌词中的语言复杂性和社会文化趋势。利用涵盖146位有影响力的艺术家、时间跨度为四个十年(1980-2020)的3,814首歌曲数据集,我们运用自然语言处理技术量化了歌词复杂性的多个维度。我们的分析结果显示,在研究期间词汇多样性增加了23.7%,同时东海岸艺术家的词汇变化率比其他地区高17.3%。韵脚密度整体增加了34.2%,中西部艺术家表现出最高的技术复杂度(每行3.04个韵脚)。主题建模揭示了主题内容的重大转变,社会正义主题从内容的28.5%下降到13.8%,反思性主题则从7.6%增加到26.3%。情感分析表明,社会政治危机期间歌词变得更加消极,主要社会动荡后极性减少了0.31。多维度分析揭示了四种典型风格,这些风格与地理起源(r=0.68,p<0.001)和时间阶段(r=0.59,p<0.001)之间有较强的关联。这些发现为嘻哈作为一种艺术形式以及其对社会动态的反映提供了量化证据,提供了语言创新与文化背景在流行音乐中的互动关系的见解。