LLM2D
大型语言模型时代的数据取证
Digital Forensics in the Age of Large Language Models
作者: Zhipeng Yin, Zichong Wang, Weifeng Xu, Jun Zhuang, Pallab Mozumder, Antoinette Smith, Wenbin Zhang
发布日期: 4/7/2025
arXiv ID: oai:arXiv.org:2504.02963v1

摘要

arXiv:2504.02963v1 类型:交叉学科 摘要:数字取证在现代调查过程中扮演着至关重要的角色,利用专门的方法系统地收集、分析和解释用于司法程序的数字证据。然而,传统的数字取证技术主要依赖于耗时的手动劳动过程,随着数字数据的快速增长和复杂性,这些方法变得越来越不足以应对。为此,大型语言模型(LLMs)已经涌现为能够自动化和增强各种数字取证任务的强大工具,显著地改变了该领域。尽管已经取得了一定的进展,但一般用户和取证专家往往缺乏对LLM的功能、原理和限制的全面理解,这限制了LLM在取证应用中充分发挥潜力。为了填补这一缺口,本文旨在提供一个易懂且系统的概述,说明LLM是如何变革数字取证方法的。具体而言,本文将回顾数字取证的基本概念,以及LLM的发展演变,并强调LLM的卓越能力。为了连接理论与实践,本文讨论了相关示例和实际场景。此外,本文还批判性地分析了将LLM应用于数字取证的当前局限性,包括与幻觉、可解释性、偏见和伦理问题相关的问题。此外,本文还概述了未来研究的前景,强调在取证过程中有效使用LLM以实现透明性、问责制和标准化的必要性。