LLM2D
具有因果保证的高效模型评估计算理论
A Computational Theory for Efficient Model Evaluation with Causal Guarantees
作者: Hedong Yan
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2503.21138v3

摘要

arXiv:2503.21138v3 评价类型: 替换 摘要:为了降低模型实验评估的成本,我们提出了一种预测和决策模型的计算评价理论:构建评价模型以加速评价过程。我们证明了给定评价模型的通用误差和通用因果效应误差的上界。我们还证明了所提出的评价模型在评估指标下估计因果效应的效率和一致性。为了学习评价模型,我们提出了一种元学习器来处理异质评价对象空间问题。与现有评价方法相比,在包括个体药物、科学模拟、社会实验、商业活动和量子交易在内的12个场景中,我们的(条件)评价模型减少了24.1%-99.0%的评估误差。评估时间相比实验或模拟减少了3到7个数量级。