LLM2D
PyPotteryInk:从素描到出版级考古图的一步扩散模型
PyPotteryInk: One-Step Diffusion Model for Sketch to Publication-ready Archaeological Drawings
作者: Lorenzo Cardarelli
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06897v1

摘要

arXiv:2502.06897v1 类型: cross 摘要: 考古陶器文档传统上需要耗时的手动过程,将铅笔草图转换为可供出版的墨迹图。我介绍了 PyPotteryInk,这是一个开源的自动化流水线,使用单步扩散模型将考古陶器草图转换为标准化的出版级图纸。该系统基于修改过的 img2img-turbo 架构,在单次前向传递中处理图纸,同时保留关键形态细节并维持考古学文档标准和分析价值。模型采用高效的基于补丁的方法,具有动态重叠,能够在输入图纸大小变化的情况下产生高分辨率输出。我通过一个意大利史前陶器图纸的数据集展示了该方法的有效性,该方法能够捕捉到精细细节如装饰图案以及结构元素如器皿轮廓或握持元素。专家评估证实,生成的图纸符合出版标准,且显著减少了每张图纸的处理时间,从几小时缩短到几秒钟。该模型可以通过少量训练数据微调以适应不同的考古学背景,使其能够在各种陶器文档风格中具有通用性。提供了预训练模型、Python 库和全面的文档,以促进考古研究社区的采用。