LLM2D

摘要

解释人工智能（AI）的决策是当今AI领域的一大挑战，尤其是在医疗和法律等敏感领域。然而，解释决策背后的理由对于基于人类的审议来说也是一个主要问题，因为证明做出某个特定决策的“原因”非常重要。例如，住院医师不仅需要提供（可能是正确的）诊断，还需要解释他们如何得出某个结论。因此，开发新的工具来帮助住院医师训练他们的解释能力是人工智能在教育领域的中心目标。在本文中，我们遵循这一方向，并据我们所知，提出了第一个用于医学问答的多语言数据集，其中临床病例的正确和错误诊断都附有医生撰写的自然语言解释。这些解释已用论证成分（即前提、论点）和论证关系（即攻击、支持）进行人工标注，从而形成了多语言CasiMedicos-Arg数据集，该数据集包含四种语言（英语、西班牙语、法语、意大利语）的558个临床病例及其解释，我们标注了5021个论点、2313个前提、2431个支持关系和1106个攻击关系。最后，我们展示了具有竞争力的基线在这个具有挑战性的论证挖掘数据集上的表现。