LLM2D
OnPrem.LLM:一个注重隐私的文档智能工具包
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit
作者: Arun S. Maiya
发布日期: 5/14/2025
arXiv ID: oai:arXiv.org:2505.07672v2

摘要

arXiv:2505.07672v2 宣告类型: replace-cross 摘要: 我们介绍了OnPrem$.$LLM,这是一种基于Python的工具包,用于将大型语言模型(LLMs)应用于离线或受限环境中的敏感、非公开数据。该系统设计用于隐私保护用途,提供了文档处理和存储、检索增强生成(RAG)、信息提取、总结、分类以及最小配置下提示/输出处理的预构建管道。OnPrem$.$LLM 支持多个 LLM 后端——包括 llama$.$cpp、Ollama、vLLM 和 Hugging Face Transformers——支持量化模型、GPU 加速,并且可以无缝切换后端。尽管设计用于完全本地执行,但 OnPrem$.$LLM 也支持在允许的情况下与广泛的云 LLM 提供商集成,从而使性能与数据控制达到平衡。无代码 web 界面增强了非技术人员的访问性。