摘要
arXiv:2504.10650v1 宣告类型: cross
摘要:随着语音对话接口在语音技术和语言技术发展推动下逐步普及,它们对人类沟通的影响引起了重要的关注。虽然书面沟通通过词汇和风格选择来传达身份,但基于语音的交互本质上放大了社会指数性元素——如口音、语调和语音风格——这些更显著地传达了社会身份和群体归属。有证据表明,即使是像电视这样的被动媒体也可能会影响观众的语言模式。与被动媒体不同,对话AI是互动的,创造了一种更沉浸和相互作用的动力,具有更大的潜力影响人们在日常交流中的说话方式。这种增强的影响可以从诸如声学-语调同步性和语言适应性等自然发生的现象中产生,这些现象在互动中自然发生,使用户能够根据系统调整他们的语音模式。尽管这种现象仍处于起步阶段,但其潜在的社会影响可能为组织、运动和品牌提供了一种微妙而强大的途径,以塑造和控制公众形象和社会身份。我们认为,AI生成语音的社会指数性影响值得关注,并应成为跨学科研究的重点,利用新的和现有的方法和技术,更好地理解其影响。