LLM2D
Home
Arxiv
返回列表
大规模语言模型在统计准确生成表格数据方面的简要说明
A Note on Statistically Accurate Tabular Data Generation Using Large Language Models
作者:
Andrey Sidorenko
发布日期:
5/7/2025
arXiv ID:
oai:arXiv.org:2505.02659v2
摘要
arXiv:2505.02659v2 Announce Type: 跨领域 摘要:大规模语言模型(LLMs)在合成表格数据方面显示出潜力,然而现有的方法难以保留复杂的特征依赖性,特别是在类别变量之间。本文提出了一种基于概率的提示方法,利用LLMs估计条件分布,从而实现更准确和可扩展的数据合成。结果强调了提示概率分布以增强LLM生成的表格数据统计真实性的潜力。
查看原文
下载 PDF