当前位置>主页 > 期刊在线 > 信息技术 >

信息技术2018年11期

基于CTPN 的网店工商信息提取系统的研究和实现
靳振伟
(宁夏大学 信息工程学院,宁夏 银川 750021)

摘  要:本文提到的系统首先对图片进行预处理,消除水印等图片噪声,将图像二值化。CTPN 利用同一文本线的字符可以互用上下文的特点,降低了检测难度。DenseNet 在ResNet 的基础上进行改进,减少了参数,改善了神经网络的性能。使用CTPN 进行文本检测,使用DenseNet 和CTC 进行文本识别,获得了较高的准确率。


关键词:文本检测;文本识别;CTPN



中图分类号:TP393.09;TP311.13         文献标识码:A         文章编号:2096-4706(2018)11-0027-02


Research and Implementation of Online Business Information Extraction SystemBased on CTPN

JIN Zhenwei

(Ningxia University,School of Information Engineering,Yinchuan 750021,China)

Abstract:The system mentioned in this paper firstly preprocesses the image,eliminates the image noise such as watermark,andbinarizes the image. CTPN can reduce the difficulty of detection by using the characters of the same text line. DenseNet is improved on thebasis of ResNet,which reduces parameters and improves the performance of neural network. CTPN is used for text detection DenseNetand CTC are used for text recognition,and higher accuracy is obtained.

Keywords:detect text;recognize text;CTPN


参考文献:

[1] 马颖颖. 数字水印攻击方法的一些研究 [D]. 杭州:杭州电子科技大学,2011.

[2] 万松. 基于Tesseract-OCR 的名片识别系统的研究与实现 [D]. 广州:华南理工大学,2014.

[3] Zhi Tian,Weilin Huang,Tong He,et al.Detecting Text inNatural Image with Connectionist Text Proposal Network [M].Cham:Springer International Publishing,2016:56-72.

[4] 常玲玲,马丙鹏,常虹,等. 深度网络结构在行人检测任务中的性能对比 [J]. 计算机仿真,2017,34(7):373-377+411.

[5] 方清. 基于深度学习的自然场景文本检测与识别 [D]. 成都:电子科技大学,2018.


作者简介:靳振伟(1995.08-),男,汉族,山东菏泽人,本科,研究方向:数据挖掘、移动互联网。