摘要
领域专家与数据科学家合作,探索利用机器学习技术解决其问题的需求日益增长。从领域问题/疑问出发,基于机器学习的解决问题通常包括三个步骤:(1)将业务问题(问题领域)表述为数据分析问题(解决方案领域),(2)根据领域需求和可用数据的属性,勾勒出基于机器学习的高层次解决方案模式,(3)设计和优化解决方案模式的不同组成部分。必须存在大量机器学习研究人员公认的、机器学习从业者常规应用的机器学习问题解决知识,以解决最常见的问题。我们的工作涉及捕捉这一知识体系,并将其体现在一个机器学习问题解决工作台中,以帮助非机器学习专家的领域专家探索机器学习解决方案空间。本文重点讨论:1)领域问题、机器学习问题以及主要机器学习解决方案成果的表示,2)一种启发式匹配函数,该函数有助于识别最适用于当前领域问题的机器学习算法家族,考虑到领域(专家)需求和训练数据的特征。我们回顾了相关工作,并概述了验证工作台的策略。