arXiv 论文列表

作者: Dian W. Tjondronegoro

人工智能（AI）有潜力彻底改变各个领域，但其应用往往受到对数据隐私、安全和对 AI 能力理解的担忧阻碍。本文通过回顾领先国家的国家 AI 战略，综合了 AI 治理方法、战略主题以及 AI 应用的推动因素和挑战。主要贡献是开发了 EPIC（教育、伙伴关系、基础设施、社区）框架，该框架将 AI 实施要求与成功和持续的 AI 部署实现社会影响和公共利益相匹配。通过对最新 AI 战略文件的多种视角内容分析，本文对各国 AI 治理战略进行了结构化比较。研究结果为政府、学术界、行业和社区提供了宝贵的见解，以实现负责任且值得信赖的 AI 部署。未来工作应侧重于纳入发展中国家的具体要求，并将这些战略应用于具体的 AI 应用、行业和公共部门。

发布时间: 10/4/2024

查看原文

将人工智能的碳足迹纳入风险管理框架：银行领域可持续合规的策略与工具

作者: Nataliya Tkachenko

本文探讨了将人工智能碳足迹纳入银行业风险管理框架的重要性，强调其在实现可持续发展目标和满足监管要求方面的意义。随着人工智能在银行业运营中日益占据核心地位，其高能耗流程对碳排放贡献巨大，带来了环境、监管和声誉方面的风险。欧盟人工智能法案、企业可持续发展报告指令 (CSRD)、企业可持续发展尽职调查指令 (CSDDD) 和审慎监管局的 SS1/23 等监管框架正推动银行将环境因素纳入其人工智能模型治理。近年来，人工智能研究领域的进步，如开放式专家混合 (OLMoE) 框架和代理式 RAG 框架，为银行提供了更有效和动态的人工智能模型，在不影响性能的情况下减少碳足迹。本文以这些技术实例为例，概述了银行在风险管理框架内识别、评估和减轻人工智能碳足迹的结构化方法，包括采用节能模型、利用绿色云计算以及实施生命周期管理。

发布时间: 10/4/2024

查看原文

从专家到公众：治理政治敏感视频分析中的多模态语言模型

作者: Tanusree Sharma, Yujin Potter, Zachary Kilhoffer, Yun Huang, Dawn Song, Yang Wang

本文通过个人和集体协商，重点分析政治敏感视频，考察了多模态大型语言模型（MM-LLMs）的治理。我们进行了两步研究：第一步，对10名记者进行访谈，建立了对专家视频解读的基线理解；第二步，114名来自公众的个人使用Inclusive.AI参与协商，该平台通过去中心化自治组织（DAO）机制促进民主决策。我们的研究结果表明，虽然专家强调情感和叙事，但公众更重视事实清晰度、情况客观性和情感中立。此外，我们还探讨了不同治理机制的影响：二次投票与加权排名投票以及平等与20-80权力分配对用户如何决策AI应该如何行为的影响。具体而言，二次投票增强了人们对自由民主和政治平等的认知，而那些对AI更乐观的人认为投票过程具有更高水平的参与式民主。我们的结果表明，将DAO机制应用于帮助民主化AI治理的潜力。

发布时间: 10/4/2024

查看原文

自动场景生成：最新技术、模型、数据集、挑战和未来展望

作者: Awal Ahmed Fime, Saifuddin Mahmud, Arpita Das, Md. Sunzidul Islam, Hong-Hoon Kim

自动场景生成是一个重要的研究领域，在机器人技术、娱乐、视觉表示、训练与仿真、教育等方面有着广泛的应用。本综述全面回顾了自动场景生成的最新技术，重点关注利用机器学习、深度学习、嵌入式系统和自然语言处理 (NLP) 的技术。我们将模型分为四种主要类型：变分自动编码器 (VAE)、生成对抗网络 (GAN)、Transformer 和扩散模型。详细探讨了每个类别，讨论了各种子模型及其对该领域的贡献。我们还回顾了最常用的数据集，例如 COCO-Stuff、Visual Genome 和 MS-COCO，这些数据集对于训练和评估这些模型至关重要。考察了场景生成的方法，包括图像到 3D 转换、文本到 3D 生成、UI/布局设计、基于图的方法和交互式场景生成。在评估模型性能的背景下，讨论了诸如 Fréchet Inception Distance (FID)、Kullback-Leibler (KL) Divergence、Inception Score (IS)、Intersection over Union (IoU) 和 Mean Average Precision (mAP) 等评估指标。综述指出了该领域的关键挑战和局限性，例如保持真实感、处理包含多个对象的复杂场景以及确保对象关系和空间排列的一致性。通过总结最新进展并指出改进方向，本综述旨在为从事自动场景生成研究的科研人员和从业人员提供宝贵的资源。

发布时间: 10/4/2024

查看原文

食品营销中的 AI：从个性化推荐到预测分析，对比传统广告技术与 AI 驱动策略

作者: Elham Khamoushi

人工智能（AI）通过提供个性化推荐、消费者行为预测和活动优化等先进技术，彻底改变了食品营销。本文探讨了从传统的电视、广播和印刷等广告方式向 AI 驱动的策略的转变。传统方法在建立品牌知名度方面取得了成功，但缺乏现代消费者所要求的个性化程度。AI 利用来自消费者购买历史、浏览行为和社交媒体活动的数据来创建高度定制的营销活动。这些策略可以更准确地推荐产品，预测消费者的需求，并最终提高客户满意度和用户体验。AI 通过自动化劳动密集型流程来增强营销工作，从而提高效率并节省成本。它还使营销信息能够不断适应，确保它们随着时间的推移保持相关性和吸引力。虽然 AI 在个性化和效率方面带来了重大益处，但也面临着挑战，特别是对技术和熟练专家的巨额投资。本文比较了传统和 AI 驱动的食品营销技术的优缺点，为营销人员如何利用 AI 在不断变化的数字环境中创建更有效、更有针对性的营销策略提供了宝贵的见解。

发布时间: 10/4/2024

查看原文

医疗保健领域中基于隐私保护的 SAM 量化方法，用于实现高效边缘智能

作者: Zhikai Li, Jing Zhang, Qingyi Gu

全球不同地区医疗人员专业知识和医疗资源的差距是一个紧迫的社会问题。人工智能技术为缓解这一问题提供了新的机遇。分割一切模型 (SAM) 擅长智能图像分割，在医疗监测和辅助诊断中展现出卓越的性能。然而，SAM 巨大的计算和存储开销给在资源有限的边缘设备上部署带来了重大挑战。量化是模型压缩的有效解决方案；然而，传统方法严重依赖原始数据进行校准，这引发了对医疗数据隐私和安全的广泛担忧。在本文中，我们提出了一种针对 SAM 的无数据量化框架，称为 DFQ-SAM，它在没有任何原始数据的情况下学习和校准量化参数，从而在模型压缩过程中有效地保护数据隐私。具体来说，我们提出了用于分割的伪正标签演化，结合补丁相似性，以充分利用预训练模型中的语义和分布先验，这有助于高质量数据合成作为真实数据的替代。此外，我们引入了尺度重新参数化以确保低比特量化的准确性。我们对各种数据集进行了广泛的分割实验，DFQ-SAM 在低比特量化方面始终提供显著的性能。DFQ-SAM 消除了云边协作中数据传输的需要，从而保护敏感数据免受潜在攻击。它能够在边缘提供安全、快速和个性化的医疗保健服务，这提高了系统效率并优化了资源分配，从而促进了人工智能在全球医疗保健中的广泛应用。

发布时间: 10/4/2024

查看原文

从文本到多模态：探索大型语言模型在医疗实践中的演变和影响

作者: Qian Niu, Keyu Chen, Ming Li, Pohsun Feng, Ziqian Bi, Junyu Liu, Benji Peng

大型语言模型 (LLMs) 已迅速从基于文本的系统发展为多模态平台，对包括医疗保健在内的各个领域产生了重大影响。这篇综合综述探讨了 LLMs 向多模态大型语言模型 (MLLMs) 的发展及其在医疗实践中的日益增长的影响力。我们考察了 MLLMs 在医疗保健中的现状，分析了它们在临床决策支持、医学影像、患者参与和研究中的应用。这篇综述强调了 MLLMs 在整合多种数据类型（如文本、图像和音频）方面的独特能力，以提供对患者健康的更全面见解。我们还探讨了 MLLM 实施所面临的挑战，包括数据限制、技术障碍和伦理考量。通过识别关键的研究差距，本文旨在指导未来在数据集开发、模态对齐方法和建立伦理准则等方面的研究。随着 MLLMs 继续塑造医疗保健的未来，了解它们的潜力和局限性对于将它们负责任且有效地整合到医疗实践中至关重要。

发布时间: 10/4/2024

查看原文

大型语言模型在约鲁巴语、马拉雅拉姆语和英语中的文化意识评估

作者: Fiifi Dawson, Zainab Mosunmola, Sahil Pocker, Raj Abhijit Dandekar, Rajat Dandekar, Sreedath Panat

尽管大型语言模型 (LLM) 在许多复杂任务中表现出色，但它们对区域语言和文化的理解和功能尚未得到充分研究。本文探讨了各种 LLM 理解两种区域语言的文化方面的能力：马来亚语（印度喀拉拉邦）和约鲁巴语（西非）。利用霍夫斯泰德的六个文化维度：权力距离 (PDI)、个人主义 (IDV)、成就和成功动机 (MAS)、不确定性规避 (UAV)、长期导向 (LTO) 和放纵 (IVR)，我们量化了基于 LLM 的响应的文化意识。我们证明，尽管 LLM 在英语方面表现出高度的文化相似性，但它们未能捕捉到马来亚语和约鲁巴语在这些 6 个指标上的文化细微差别。我们还强调了需要使用文化丰富的数据集进行大规模区域语言 LLM 训练。这将对增强基于聊天的 LLM 的用户体验以及提高大规模基于 LLM 代理的市场研究的有效性具有重大意义。

发布时间: 10/4/2024

查看原文

只需要宣传就够了

作者: Paul Kronlund-Drouault

作为一门相对较新的研究领域，特别是超出抽象数学领域，机器学习（ML）在大型语言模型（LLM）的政治方面，特别是关于对齐过程及其政治维度方面，鲜有研究。该过程可以像提示工程一样简单，但也可以非常深入，并完全影响不相关的问题。例如，政治导向的对齐对 LLM 的嵌入空间以及政治概念在该空间中的相对位置有非常大的影响。通过使用专门的工具来评估一般的政治偏见并分析对齐的影响，我们可以收集新的数据来了解其原因以及对社会可能产生的后果。事实上，采取社会政治方法，我们可以假设大多数大型 LLM 都与马克思主义哲学所称的“统治意识形态”保持一致。随着人工智能在政治决策中的作用，无论是在公民层面还是在政府机构，这种偏见都可能对社会变革产生巨大影响，要么通过创造一种新的、阴险的社会统一化途径，要么通过允许隐藏的极端主义观点在人民中获得影响力。

发布时间: 10/4/2024

查看原文

增强人工智能驱动的客户互动中的透明度

作者: Tara DeZao

本文重点强调了透明度和问责制的重要性，旨在解决构建消费者对人工智能驱动的客户参与的信任这一关键挑战。尽管人工智能有可能彻底改变业务运营并提升客户体验，但人们普遍担心虚假信息和人工智能决策过程的不透明性阻碍了信任。调查显示，消费者对其与人工智能的互动缺乏了解，以及对人工智能算法中存在偏差和公平性的担忧。本文倡导开发可解释的人工智能模型，这些模型对消费者和组织领导者都透明且易于理解，从而减轻潜在偏差并确保道德使用。它强调了组织承诺超越单纯的监管合规的透明度实践的重要性，包括培养问责文化，优先考虑明确的数据政策并保持与利益相关者的积极互动。通过采用透明度和可解释性的整体方法，企业可以培养对人工智能技术的信任，弥合技术创新和消费者接受之间的差距，并为更道德、更有效的人工智能驱动的客户互动铺平道路。

发布时间: 10/4/2024

查看原文