当前位置>主页 > 期刊在线 > 信息技术 >

信息技术22年12期

基于手机的 OCR 测试集构建及自动化评估模型
曹慧静
(传音控股技术有限公司,上海 202106)

摘  要:市场调研发现,由于印度存在复杂多样的本地语言,印度市场仍然存有大量的用户因为本地语言使用不畅而导致使用手机体验不佳。国内手机厂商在印度市场语言翻译方面亟待本土化,这对手机厂商来说是个很大的机会,同时伴随着人工智能在图像识别领域的不断发展,可以借助图像文本识别技术来解决语言翻译问题。在图像文本识别领域,文本识别的准确率受测试数据集影响,文本提取的准确率越高,翻译的准确性才会越高,所以根据用户真实场景去构建测试集尤为重要。文章提供了适用于手机图像文本识别数据集构建的方法、自动化统计文本识别准确率的模型和其自动化实现方法。


关键词:图像识别;测试集;自动化;OCR 评估模型



DOI:10.19850/j.cnki.2096-4706.2022.012.003


中图分类号:TP391.4                                      文献标识码:A                                 文章编号:2096-4706(2022)12-0011-04


OCR Test Set Construction and Automatic Evaluation Model Based on Mobile Phone

CAO Huijing

( Transsion Holdings Technology Company, Shanghai 202106, China)

Abstract: Market research shows that due to the complex and diverse local languages in India, there are still a large number of users in the Indian market who have poor mobile phone experience due to poor use of local languages. Domestic mobile phone manufacturers urgently need to localize language translation in the Indian market, which is a great opportunity for mobile phone manufacturers. At the same time, with the continuous development of artificial intelligence in the field of image recognition, image text recognition technology can be used to solve the problem of language translation. In the field of image text recognition, the accuracy of text recognition is affected by the test data set. The higher the accuracy of text extraction, the higher the accuracy of translation. Therefore, it is particularly important to build the test set according to the user’s real using scene. This paper provides a method suitable for the construction of mobile phone image text recognition data set, a model for automatic statistical text recognition accuracy and its automatic implementation method.

Keywords: image recognition; test set; automation; the OCR evaluation model


参考文献:

[1] 张国锋 . 人工智能下深度学习的语音识别方法分析 [J]. 电子技术与软件工程,2020(11):176-177.

[2] 王栋 . 人工智能 OCR 技术的应用研究 [J]. 电子技术与软件工程,2022(1):122-125.

[3] 康雪玮,于文雅,谭钧恺,等 . 基于深度学习的债券图表数据光学字符识别(OCR)检测与文本识别的应用 [J]. 办公自动化,2021,26(14):54-58.

[4] 王日花 . 基于深度学习的智能 OCR 识别关键技术及应用研究 [J]. 邮电设计技术,2021(8):20-24.

[5] 傅汉东 . 光学字符识别技术在高校会计核算中的实践和应用 [J]. 现代经济信息,2020(12):64-65+67.

[6] 许郭樑 . 一种基于 OCR 技术在评价机器人轨迹可行性的应用 [J]. 内燃机与配件,2020(12):233-234.

[7] 吴鹏 . 人工智能识别技术在广电领域的应用畅想 [J]. 广播电视信息,2018(5):37-39.

[8] 陈芳芳,吴艳,王丹萍 . 论人工智能技术发展及在电力客服系统的应用 [J]. 电子世界,2021(7):176-177.

[9] 王珂,杨芳,姜杉 . 光学字符识别综述 [J]. 计算机应用研究,2020,37(S2):22-24.

[10] 张晶,李雅琴,王博文 . 光学字符识别(OCR)技术在内部审计中的实践应用 [J]. 纳税,2020,14(1):275.


作者简介:曹慧静(1986.10—),女,汉族,江西九江人,高级测试工程师,硕士,研究方向:软件测试。