LLM2D
基于云的原生可扩展管道,用于从单目智能手机图像高效重建三维模型
Scalable Cloud-Native Pipeline for Efficient 3D Model Reconstruction from Monocular Smartphone Images
作者: Potito Aghilar, Vito Walter Anelli, Michelantonio Trizio, Tommaso Di Noia
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19322v1

摘要

近年来,3D 模型在娱乐、制造和仿真等各个领域越来越受欢迎。然而,手动创建这些模型可能是一个耗时且资源密集的过程,对于大规模工业应用来说不切实际。为了解决这个问题,研究人员正在利用人工智能和机器学习算法来轻松自动生成 3D 模型。在本文中,我们提出了一种新颖的云原生管道,可以从使用智能手机摄像头拍摄的单目 2D 图像自动重建 3D 模型。我们的目标是提供一种高效且易于采用的解决方案,以满足工业 4.0 标准,创建数字孪生模型,从而通过加速培训来增强人员专业知识。我们利用 NVIDIA 研究实验室开发的机器学习模型,以及一个定制设计的姿态记录器,该记录器具有基于 Google 的 ARCore 框架的独特姿态补偿组件。我们的解决方案生成一个可重复使用的 3D 模型,其中包含嵌入的材质和纹理,可在任何外部 3D 建模软件或 3D 引擎中导出和自定义。此外,整个工作流程通过采用微服务架构标准来实现,使管道中的每个组件都可以作为独立的可替换模块运行。