LLM2D

摘要

arXiv:2504.04204v1 类型: 交叉摘要：从关于潜在实体的不确定性中提取信息是许多应用领域中的关键任务，例如评估个体学生的学业成果、诊断潜在疾病或学习用户偏好。尽管自然语言是实现这一目标的强大媒介，但现有的大型语言模型（LLMs）和现有微调算法缺乏以战略方式收集信息以改进对潜在实体理解的机制。为了利用LLMs的一般化能力和世界知识来开发有效的信息收集策略，我们提出了一种适应性提取框架，该框架积极减少对潜在实体的不确定性。由于难以对抽象的潜在实体进行概率建模，我们的框架采用预测视角来定义不确定性，并利用一个元学习语言模型来模拟未来观察，从而实现复杂自然语言中的不确定性的可扩展量化。通过自回归前向模拟，我们的模型量化了新问题如何降低认识论不确定性，从而支持开发复杂的策略来选择最具信息量的下一个查询。在20个问题游戏、动态意见调查和自适应学生评估实验中，我们的方法在识别关键未知信息和提高下游预测方面始终优于基线方法，展示了在自然语言环境中战略性信息收集的潜力。