LLM2D
Home
Arxiv
返回列表
双向因式分解:从UI轨迹中提取意图的双向因式分解评估方法
Bi-Fact: A Bidirectional Factorization-based Evaluation of Intent Extraction from UI Trajectories
作者:
Sapir Caduri
发布日期:
2/20/2025
arXiv ID:
oai:arXiv.org:2502.13149v2
摘要
arXiv:2502.13149v2 宣告类型: 新 摘要: 评估从GUI中提取意图需要准确的细粒度度量标准。本文提出了一种名为Bi-Fact的新方法,该方法将意图分解为原子事实,并进行双向比较以评估精确度和召回率。实验表明,Bi-Fact与现有度量标准相比,其与人类判断的关联性更强,从而为基于UI的意图理解建立了更为 robust 的评估框架。
查看原文
下载 PDF