摘 要:数据分析与可视化有助于人们从繁杂的数据中快速获取有用的信息。利用Python 中的Pandas 对结构化数据进行分析,采用Matplotlib 进行图表展示;从非结构化数据中提取文本,利用Jieba 对文本进行分词处理,利用Wordcloud 进行词云展示。利用Flask 对上述图表及词云进行Web 发布,构建数据分析与可视化平台,成本较低,简便易用。
关键词:可视化;Pandas;Matplotlib;Jieba;Wordcloud;
中图分类号:TP312.1 文献标识码:A 文章编号:2096-4706(2019)21-0007-03
Research on Data Analysis and Visualization Platform Based on Python
SONG Yongsheng1,HUANG Rongmei2,WANG Jun1
(1.Jiangsu College of Engineering and Technology,Nantong 226007,China;2.Nantong Museum,Nantong 226001,China)
Abstract:Data analysis and visualization can help people get useful information from complex data quickly. We use Pandas in Python to analyze the structured data,and use Matplotlib to display the charts;we extract the text from the unstructured data,use Jieba to segment the text,and use Wordcloud to display the word cloud. Flask is used to publish the above charts and word cloud on the Web and build a data analysis and visualization platform,which is low cost and easy to use.
Keywords:visualization;Pandas;Matplotlib;Jieba;Wordcloud
基金项目:江苏省现代教育技术研究项目:数据挖掘在高职网络学习平台中的应用研究(项目编号:2018-R-64928);江苏省教育信息化研究课题:大数据环境下的高职学生行为分析及预警机制研究(项目编号:20172168);南通市科技计划项目:农用植保无人机精准喷药系统关键技术的研究(项目编号:JCZ18065);江苏工程职业技术学院科研计划项目:农用无人机动力锂电池在线均衡技术的研究(项目编号:GYKY/2016/13);江苏省现代教育技术研究项目:基于校园一卡通的高职学生行为分析平台建设与研究(项目编号:2017-R-53720)。
参考文献:
[1] 宋永生,吴新华. 基于Python 的Moodle 学习平台日志分析 [J]. 计算机时代,2018(10):19-21+25.
[2] 张若愚.Python 科学计算:第2 版 [M]. 北京:清华大学出版社,2016.
[3] 祝永志,荆静. 基于Python 语言的中文分词技术的研究 [J]. 通信技术,2019,52(7):1612-1619.
[4] 严明,郑昌兴.Python 环境下的文本分词与词云制作 [J].现代计算机(专业版),2018(34):86-89.
作者简介:宋永生(1984-),男,汉族,江苏徐州人,就职于图文信息中心,教师,工程师,硕士,研究方向:机器学习及物联网技术研究。