摘 要:文章以 Python 语言为基础编写了一个爬虫程序,用于获取网络上关于图书的信息,经过数据清洗和筛选后存入到数据库中实现数据的长久保存。在经过广泛查阅相关主题著作、论文、使用手册等资料后,在借鉴前人的研究成果的基础上,参考了图书评价人员给出的图书得分,尝试去除网络水军对图书得分的影响,最后通过给定的新的图书分值计算公式,重新计算图书得分,并以新的分数推荐给用户。关键词:Python;图书;推荐;查
关键词:Python;图书;推荐;查询
DOI:10.19850/j.cnki.2096-4706.2022.05.008
中图分类号:TP311 文献标识码:A 文章编号:2096-4706(2022)05-0030-04
Collection and Display Research of Book Information Based on Python
SUN Jun1, LI Qiuyue 1, ZHAO Chenyue 2
(1.Zhengzhou Technical College, Zhengzhou 450121, China; 2.Zhengzhou Information Engineering Vocational College, Zhengzhou 450121, China)
Abstract: This paper writes a crawler program based on the Python language to obtain information about books on the Internet. After data cleaning and filtering, it is stored in the database to achieve long-term data storage. After extensive review of relevant subject works, papers, user manuals and other materials, on the basis of using for reference from previous research results, and referring to the book scores given by book reviewers, it tries to remove the influence of the Internet army on the book scores. Finally, through the given new book score calculation formula, the book score is recalculated, and the new score is recommended to the user.
Keywords: Python; book; recommendation; query
参考文献:
[1] 李琳 . 基于 Python 的网络爬虫系统的设计与实现 [J]. 信息通信,2017(9):26-27.
[2] 杨国军 . 基于 Python 的数据爬虫的设计与实现 [J]. 数字技术与应用,2020,38(10):153-154+158.
[3] DONEY A B. 像计算机科学家一样思考 Python [M]. 赵普明,译,北京:人民邮电出版社,2016.
[4] LAWSON. 用 Python 写网络爬虫 [M]. 李斌,译,北京:人民邮电出版社,2016.
[5] NELLI F.Python 数据分析实战 [M]. 杜春晓,译,北京:人民邮电出版社,2016.
[6] 刘增杰 .MySQL 5.7 从入门到精通(视频教学版) [M].北京:清华大学出版社,2016.
[7] 王文民 . 中国图书市场分析 [D]. 成都:西南交通大学,2007.
[8] 刘高军,印佳明 . 基于图书特征及词典的豆瓣图书垃圾评论识别 [J]. 计算机技术与发展,2019,29(11):107-112.
[9] 丁媛媛 . 浅析豆瓣图书“一星运动” [J]. 新闻研究导刊,2020,11(9):71-72.
作者简介:孙俊(1994.12—),男,汉族,河南郑州人,助教,硕士,研究方向:人工智能、自然语言处理;李秋月(1992.01—),女,汉族,河南周口人,助教,硕士,研究方向:网络信息安全、物联网技术、人工智能应用;赵晨悦(1994.06—),男,汉族,河南郑州人,助教,学士,研究方向:应用程序开发、计算机网络。