当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术23年2期

基于空间注意力的图像分类网络研究
徐海燕,郝萍萍
(山东华宇工学院,山东 德州 253034)

摘  要:针对以往的图像分类方法利用手工提取的特征(或通过神经网络提取的特征)、空间信息关注不足等问题,文章提出一种基于空间注意力的图像分类网络。该网络利用空间注意力模块,对深度网络提取的视觉特征进行空间约束。利用特征的空间信息,使得网络能够对特征在空间上的重要性加以区分,从而使其更具判别性。采用 CIFAR-10 和 CIFAR-100 测试集分别进行测试,测试结果表明,该文提出的图像分类网络的图像分类效果明显优于其他深度学习方法。


关键词:空间注意力;深度学习;计算机视觉;图像分类



DOI:10.19850/j.cnki.2096-4706.2023.02.024


基金项目:2021 年山东华宇工学院校级科研项目(2021KJ17)


中图分类号:TP391.4                                      文献标识码:A                                文章编号:2096-4706(2023)02-0098-03


Research on Image Classification Network Based on Spatial Attention

XU Haiyan, HAO Pingping

(Shandong Huayu University of Technology, Dezhou 253034, China)

Abstract: Aiming at the problems of traditional image classification methods, such as using manually extracted features (or features extracted through neural networks), insufficient attention to spatial information, this paper proposes an image classification network based on spatial attention. The network uses the spatial attention module to spatial constrain on the visual features extracted by the depth network. Using the spatial information of features, the network can distinguish the importance of features in space, thus making them more discriminative. Test with CIFAR-10 and CIFAR-100 test sets respectively, test results show that the proposed image classification network is superior to other depth learning methods in image classification.

Keywords: spatial attention; deep learning; computer vision; image classification


参考文献:

[1] 林陶,黄国荣,郝顺义,等 . 尺度不变特征转换算法在图像特征提取中的应用 [J]. 计算机应用,2016,36(6):1688-1691+1698.

[2] DÉNIZ O,BUENO G,SALIDO J,et al. Face recognition using histograms of oriented gradients [J].Pattern recognition letters, 2011,32(12):1598-1603.

[3] 王周春,崔文楠,张涛 . 基于支持向量机的长波红外目标分类识别算法 [J]. 红外技术,2021,43(2):153-161.

[4] CUNNINGHAM P,DELANY S J. K-nearest neighbour classifiers-a tutorial [J].ACM Computing Surveys (CSUR),2021,54(6):1-25.

[5] MEI Y J,JIN H R,YU B,et al. Visual geometry groupUNet: deep learning ultrasonic image reconstruction for curved parts [J]. The Journal of the Acoustical Society of America,2021,149(5):2997-3009.

[6] WU Z,SHEN C,VAN DEN HENGEL A. Wider or deeper: Revisiting the resnet model for visual recognition [J].Pattern Recognition,2019,90:119-133.

[7] 陈鑫华,钱雪忠,宋威 . 基于轻量级特征融合卷积网络的图像分类算法 [J]. 计算机工程,2021,47(11):268-275.

[8] EL-SAWY A,EL-BAKRY H,LOEY M. CNN for handwritten arabic digits recognition based on LeNet-5 [C]//International conference on advanced intelligent systems and informatics.[S.I.]: Cham,2016:566-575.

[9] ANAND R,SHANTHI T,NITHISH M S,et al. Face recognition and classification using GoogleNET architecture [C]//Soft computing for problem solving. Singapore:Springer,2020:261-269.

[10] ZHANG Y,TENG Z Y.Natural language processing [M]. Cambridge:Cambridge University Press,2021. 

[11] 鲍鹏,徐昊 . 基于图注意力时空神经网络的在线内容流行度预测 [J]. 模式识别与人工智能,2019,32(11):1014-1021.

[12] 王宇航,周永霞,吴良武 . 基于高斯函数的池化算法 [J]. 计算机应用,2022,42(9):2800-2806.

[13] 徐海燕 . 基于通道相似度注意力的图像分类研究 [J]. 信息技术与信息化,2021(11):78-80.


作者简介:徐海燕(1993.08—),女,汉族,山东德州人,助教,硕士研究生,研究方向:计算机视觉、图像分类、推荐系统研究;郝萍萍(1977.12—),女,汉族,山东德州人,副教授,硕士研究生,研究方向:计算机网络技术、物联网技术。