LLM2D

摘要

arXiv:2504.18793v1 Announce Type: cross 摘要：AI驱动应用的快速采用需要高性能、可扩展且高效的云数据库解决方案，传统架构在应对需要实时数据访问、向量搜索和低延迟查询的AI驱动工作负载时往往捉襟见肘。本文探讨了云原生数据库如何通过利用如向量数据库（pgvector）、图数据库（AWS Neptune）、NoSQL存储（Amazon DocumentDB、DynamoDB）以及关系型云数据库（Aurora MySQL和PostgreSQL）等特定构建技术，来支持AI驱动的应用程序。文章介绍了将AI工作负载与云数据库集成的体系结构模式，包括使用大规模语言模型（LLM）的检索增强生成（RAG）[1]、实时数据管道、基于AI的查询优化以及基于嵌入的搜索。性能基准测试、可扩展性考虑和成本高效策略被评估，以指导AI增强型应用的设计。来自医疗保健、金融和客户体验等行业的真实案例研究表明，企业在利用云数据库增强AI能力的同时，确保企业安全、治理和遵守企业及监管标准的情况。通过提供AI与云数据库集成的全面分析，本文为研究人员、架构师和企业提供了一本实用指南，以构建在云环境中优化性能、可扩展性和成本效益的下一代AI应用。