摘 要:本文采用网络爬虫技术,根据关键字自动收集所用图片数据集,并对爬取到的图片进行除杂与标注,省去了人工收集的过程,提高了制作数据集的效率。搭建并训练了一个9 层的卷积神经网络模型用于处理爬取图片的自动分类,经实验证明,训练后的模型对6 类球和5 类犬的识别准确率可达90% 以上,可以用于网络爬取图片的自动分类。
关键词:网络爬虫;图像分类;神经网络;深度学习
中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2019)15-0091-04
Automatic Classification of Crawling Pictures Based on Convolutional Neural Network
CHEN Lei,LI Hexi
(Department of Intelligent Manufacturing,Wuyi University,Jiangmen 529020,China)
Abstract:In this paper,web crawler technology is used to automatically collect image data sets according to keywords,and to remove clutter and label the crawled images,which saves the process of manual collection and improves the efficiency of data collection.A 9-layer convolution neural network model is constructed and trained to process the automatic classification of crawling pictures.Experiments prove that after training,the recognition accuracy of six kinds of balls and five kinds of dogs can reach more than 90%,which can be used for the automatic classification of crawling pictures on the network.
Keywords:web crawler;image classification;neural network;in-depth learning
基金项目:广东省大学生创新创业训练计划项目:机器学习算法研究及应用(项目编号:201711349092)。
参考文献:
[1] 杨定中,赵刚,王泰. 网络爬虫在Web 信息搜索与数据挖掘中应用 [J]. 计算机工程与设计,2009,30(24):5658-5662.
[2] 李彦冬,郝宗波,雷航. 卷积神经网络研究综述 [J]. 计算机应用,2016,36(9):2508-2515+2565.
[3] 田娟,李英祥,李彤岩. 激活函数在卷积神经网络中的对比研究 [J]. 计算机系统应用,2018,27(7):43-49.
[4] 张铃,张钹,吴福朝. 对图形识别具有平移、旋转、伸缩不变性的神经网络 [J]. 计算机学报,1998,21(2):127-136.
[5] 江彤彤,成金勇,鹿文鹏. 基于卷积神经网络多层特征提取的目标识别 [J]. 计算机系统应用,2017,26(12):64-70.
[6] 黄文坚,唐源.TensorFlow 实战 [M]. 北京:电子工业出版社,2017(2):18-20.
作者简介:
陈磊(1996.07-),男,汉族,广东湛江人,本科,工学学士,研究方向:计算机应用技术;
李鹤喜(1961.11-),男,汉族,辽宁昌图人,教授,博士,研究方向:人工智能与机器视觉。