选自arXiv
作者:Xiu-ShenWei、JianxinWu、QuanCui
机器之心编译
参与:李诗萌、张倩
在本文中,来自旷视科技、南京大学和早稻田大学的研究者对基于深度学习的细粒度图像分析进行了综述,从细粒度图像识别、检索和生成三个方向展开论述。此外,他们还对该领域未来的发展方向进行了讨论。
计算机视觉(CV)是用机器来理解和分析图像的过程,是人工智能中一个重要分支。在CV的各个研究领域中,细粒度图像分析(fine-grainedimageanalysis,FGIA)是一个长期存在的基础性问题,而且在各种实际应用(比如鸟的种类、汽车模型、商品识别等)中无处不在。由细粒度特性造成的类间(inter-class)小变化和类内(intra-class)大变化使得这一问题具有极大的挑战性。由于深度学习的蓬勃发展,近年来应用了深度学习的FGIA取得了显著的进步。
本文系统地对基于深度学习的FGIA技术进行了综述。具体来说,本文将针对FGIA技术的研究分为三大类:细粒度图像识别、细粒度图像检索和细粒度图像生成。本文还讨论了其他FGIA的重要问题,比如公开可用的基准数据集及其在相关领域的特定应用。本文在结尾处强调了未来仍需进一步探讨的几个方向以及待解决的问题。
论文:Deeplearningforfine-grainedimageanalysis:Asurvey论文链接: