摘要
本文提出了一种基于梯形自下而上卷积双向变分自编码器 (LCBVAE) 架构的编码器和解码器方法,该方法通过将阿拉伯点状有效期日期重建为填充的有效期日期来训练图像转换。我们采用了一种定制的、适应的卷积循环神经网络 (CRNN) 模型版本来满足我们的特定需求,并提高其在我们上下文中的性能,然后用 2019 年至 2027 年的填充图像训练定制 CRNN 模型,以提取有效期日期并评估 LCBVAE 模型对有效期日期识别的性能。然后可以将 (LCBVAE+CRNN) 管道集成到自动分拣系统中,以便在制造阶段提取有效期日期并相应地对产品进行分拣。此外,它可以克服手动输入有效期日期,这在商家处可能很耗时且效率低下。由于缺乏阿拉伯点状有效期日期图像,我们创建了一个阿拉伯点阵 True Type 字体 (TTF) 来生成合成图像。我们使用 60,000 张图像的非现实合成日期训练了模型,并在 2019 年至 2027 年的 3000 张现实合成日期图像上进行了测试,表示为 yyyy/mm/dd。在我们的研究中,我们证明了潜在瓶颈层在提高泛化方面的意义,当大小在图像转换等下游迁移学习任务中增加到 1024 时。所提出的方法在图像转换中使用 LCBVAE 架构实现了 97% 的准确率,该架构可以推广到任何下游学习任务,例如图像转换和重建。