当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年18期

基于 Python 爬虫的豆瓣电影影评数据可视化分析
蔡文乐,周晴晴,刘玉婷,秦立静
(甘肃农业大学,甘肃 兰州 730070)

摘  要:利用 Python 网络爬虫技术对豆瓣热度较高的电影《你好,李焕英》的影评数据进行了爬虫分析,根据爬虫所得到的影评数据信息,制作了影评词云图,通过数据可视化技术,对影评分数分布、评论数量与时间的关系,以及评论数量与城市分布的关系进行了相关的分析研究,从而直观地展示了电影上映后观众的观影感受,同时也为其他用户提供了些许观影参考。


关键词:Python;爬虫;影评;可视化



DOI:10.19850/j.cnki.2096-4706.2021.18.022


基金项目:甘肃农业大学大学生创新创业训 练计划项目(202116005)


Visual Analysis of Douban Film Review Data Based on Python Crawler

CAI Wenle, ZHOU Qingqing, LIU Yuting, QIN Lijing

 (Gansu Agricultural University, Lanzhou 730070, China)

Abstract: The Python web crawler technology is used to make the crawler analysis to the film review data of the film Hello, Li Huanying with high popularity of Douban. According to the film review data information obtained by the crawler, the cloud map of film review words is made. Through the data visualization technology, the distribution of film review scores, the relationship between the number of reviews and time, and the relationship between the number of reviews and urban distribution are analyzed and studied, so as to intuitively show the audience’s viewing experience after the film is released, and also provide some viewing references for other users.

Keywords: Python; crawler; film review; visualization


参考文献:

[1] 辛雨璇,王晓东 . 基于文本挖掘的电影评论情感分析研究[J]. 牡丹江师范学院学报(自然科学版),2021(1):25-28.

[2] 高雨菲,毛红霞 . 基于 Python 的豆瓣影视短评的数据采集与分析 [J]. 现代信息科技,2020,4(24):10-12+16.

[3] 黄蓉,毛红霞 . 基于豆瓣网某系列电影数据采集与可视化分析 [J]. 现代信息科技,2020,4(23):4-7.

[4] 黄子豪,张舒 . 网络爬虫对互联网安全的影响及“反爬”策略的研究 [J]. 科学技术创新,2021(10):120-121.

[5] 简悦,汪心瀛,杨明昕 . 基于 Python 的豆瓣网站数据爬取与分析 [J]. 电脑知识与技术,2020,16(32):51-53.

[6] 成文莹,李秀敏 . 基于 Python 的电影数据爬取与数据可视化分析研究 [J]. 电脑知识与技术,2019,15(31):8-10+ 12.


作者简介:蔡文乐(2000—),女,汉族,甘肃天水人,本科在读,研究方向:数据科学与大数据技术。