当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年22期

基于深度学习的 Web 网页信息标注方法研究
董亚男
(吉林水利电力职业学院,吉林 长春 130117)

摘  要:为了提升网页信息标注的整体效果,同时降低标注失误的概率,通过三元组构造标注预处理,在深度学习技术下标注描述目标设定,设计深度重叠标注模型,在深度学习下通过逻辑回归实现 Web 网页信息的标注。相较于传统的特征提取标注测试组和传统的自定义标注测试组,文章设计的深度学习标注测试组最终得出的标注完成率相对较高,标注失误率相对较低,具有实际应用意义。


关键词:深度学习;Web 网页;标注方法;深度控制



DOI:10.19850/j.cnki.2096-4706.2021.22.026


中图分类号:G202                                          文献标识码:A                                 文章编号:2096-4706(2021)22-0089-03


Research on Web Page Information Tagging Method Based on Deep Learning

DONG Yanan

(Jilin Polytechnic of Water Resources and Electric Engineering, Changchun 130117, China)

Abstract: In order to improve the overall effect of web page information tagging and reduce the probability of tagging errors, the tagging preprocessing is constructed through triples, description goal setting is tagged under the deep learning technology, the deep overlapping tagging model is designed, and the tagging of web page information is realized through logical regression under the deep learning technology. Compared with the traditional feature extraction tagging test group and the traditional self-defined tagging test group, the tagging completion rate of the deep learning tagging test group designed in this paper is relatively high, the tagging error rate is relatively low, which has practical application significance.

Keywords: deep learning; Web page; tagging method; depth control


参考文献:

[1] 陈前华,胡嘉杰,江吉,等 . 采用长短期记忆网络的深度学习方法进行网页正文提取 [J]. 计算机应用,2021,41(S1):20-24.

[2] 印杰,蒋宇翔,牛博威,等 . 基于深度学习的网页篡改远程检测研究 [J]. 南京理工大学学报,2020,44(1):49-54.

[3] 严靓,周欣,何小海,等 . 基于集成分类的暴恐图像自动标注方法 [J]. 太赫兹科学与电子信息学报,2020,18(2):306-312.

[4] 赵颜利,董博,雷燕 . 我国语义标注领域研究现状分析[J]. 福建师范大学学报(自然科学版),2020,36(4):17-24+36.

[5] 桂思思,张晓娟,王鑫 . 查询歧义性程度自动标注指标的替代性验证研究 [J]. 数据分析与知识发现,2019,3(2):79-89.

[6] 俞鑫,吴明晖 . 基于深度学习的 Web 信息抽取模型研究与应用 [J]. 计算机时代,2019(9):30-32.

[7] 南楠 . 基于 SPOC 与深度学习的“网页设计与布局”课程教学模式重构 [J]. 内江科技,2019,40(8):62-63.


作者简介:董亚男(1987.05—),女,汉族,吉林长春人,讲师,硕士,研究方向:计算机系统结构。