计图开源: 程明明团队提出类别激活图方法LayerCAM
图4给出了LayerCAM生成的类别激活图的定位效果,其中S5-S1表示VGG16每个阶段的最后一个卷积层,Fusion表示S3-S5的类别激活图融合。
图4 LayerCAM生成的类别激活图的定位效果
Part 2
LayerCAM由于可以应用于卷积神经网络的每个层,在多个弱监督任务上都取得了很好的效果。
表一给出不同的可视化方法生成的类别激活图的定位效果,S5-S1表示VGG16每个阶段的最后一个卷积层。
表1 不同可视化方法生成类别激活图的定位效果对比
下图给出了工业缺陷检测应用的可视化效果,图中从左到右依次是图像、标签、LayerCAM、Grad-CAM++和Grad-CAM。
图5 工业缺陷检测应用可视化效果
3. 弱监督物体分割
表3给出LayerCAM方法在弱监督语义分割上的结果(PASCAL VOC数据集)。
Part 3
计图(Jittor)是清华大学自主研发的深度学习框架,自2020年3月20日发布以来,因为元算子融合和统一计算图的两大创新,在很多应用领域,取得了优于国际主流框架的性能,程明明教授团队近期也开源了基于Jittor框架实现的的LayerCAM。
Peng-Tao Jiang, Chang-Bin Zhang, Qibin Hou, Ming-Ming Cheng, Yunchao Wei, LayerCAM: ExploringHierarchical Class Activation Maps for Localization, IEEE Transactions on Image Processing, Vol. 30, 5875-5888, 2021. Selvaraju, Ramprasaath R., etal.,Grad-cam: Visual explanations from deep networks via gradient-basedlocalization,ICCV 2017,618-626.
Chattopadhay, Aditya, et al., Grad-cam++: Generalized gradient-based visual explanations for deepconvolutional networks, IEEE Winter Conference on Applications of Computer Vision, 2018, 839-847.
Simonyan Karen and Andrew Zisserman, Very deep convolutional networks for large-scale imagerecognition, ICLR 2014.
Bolei Zhou, et al., Learning deep features for discriminative localization, CVPR 2016, 2921-2929.
GGC往期回顾
2. 计图团队联合发布可视化工具JittorVis,帮助开发者理解深度神经网络模型
3. SCI最新影响因子发布,计算机类期刊因子如何?图形学期刊影响因子有何变化?
4. 计图团队首创三角网格面片上的卷积神经网络、图像上的网络架构可以做三维模型的深度学习了!
5. External Attention:计图团队提出两层线性层结构超越Self Attention