本综述发表于Machine Intelligence Research期刊,该工作由中山大学人机物智能融合实验室(HCP Lab)负责人林倞教授指导完成,第一作者为中山大学计算机学院副研究员刘阳,本研究工作受科技部"科技创新2030-'新一代人工智能'重大项目"资助。该综述针对因果推理在多模态视觉表征学习领域的应用,分析了多模态表征学习常见的一些任务(如目标检测、场景图生成、视觉推理、视觉常识推理、视觉问答等)所面临的表征鲁棒性差、泛化能力不足的特点,充分讨论并分析了因果推理在视觉表征学习领域的发展现状和应用场景,并进一步归纳了多模态因果推理所面临的一些潜在挑战、机遇和未来研究方向。
点击阅读原文